3화. 젠슨 황(엔디비아 CEO)과 일리아 수츠케버(OpenAI 수석과학자) 대담을 통해 알아보는 ‘AI 의 오늘 그리고 내일’

[엔비디아 GTC 2023] AI, 특이점에 도달하다
시리즈 총 9화
2023.04.07

읽는시간 4

0
내가 가장 놀라운 것은 그것이(GPT-4) 실제로 작동한다는 것입니다.
(And the thing which I find most surprising is that it actually works.)

○ 최근 들어 AI는 모든 커뮤니티와 다양한 산업군에 상당한 영향력을 미치고 있음

 

  • 2002년에는 컴퓨터가 학습한다라는 개념이 없었고, 이론적으로도 학습이 가능할지에 대한 확신이 없었음
    - 그럼에도 불구하고 신경망 분야의 전문가 ‘제프리 힌튼(Geoffery Hinton)’ 교수는 사람 뇌 속 의 신경망 구조를 컴퓨터에도 동일하게 적용하는 방법에 대한 연구를 계속 해왔음
    - 초기에는 50~100개의 뉴런과 같은 소규모 신경망에서 0에서 9까지 디지털 숫자를 분류하는 것과 같은 간단한 학습으로 시작함 
  • 2012년 이미지넷(ImageNet) ILSVRC이라는 이미지 인식 대회에서 제프리 힌튼 교수팀은 알렉스 넷(AlexNet)³이라는 딥러닝 모델로 압도적인 성능을 선보이며 우승을 차지
    - 당시 기록은 고전적인 이미지 인식 기술로는 더 이상의 진전을 이루는데 한계에 다다 랐던 상황
    - 제프리 힌튼 교수팀은 GPU가 신경망 모델을 학습시키는데 유용할 수 있다는 점에 착 안해 딥러닝 모델링 과정에 적극 활용했고, 결국 믿을 수 없을 정도의 뛰어난 결과를 만들며 세상을 놀라게 했음
    - 요점은 학습 자체가 가능할지 불분명한 상황 속에서 신경망을 통해 학습이 가능하다는 것을 입증했다는 것 

○ 이후 AI 분야는 급격한 발전을 이뤘는데, 특히 OpenAI⁴는 AI가 데이터를 학습하면서 부족한 부분은 사람이 피드백을 주고 이를 반영해 나가는 방식으로 강화학습 모델을 사용함

 

  • 사람이 피드백을 주는 과정에서 실제 사용하는 말투나 문화적인 요소가 반영되면서 더욱 자 연스러운 결과물을 낼 수 있었음
    - 강화학습에 관한 다양한 경험은 예측 불가능한 환경에서 더 정확한 결과값을 찾아나가 는데 큰 도움이 되었으며 향후 ChatGPT 등에도 많은 영향을 끼침
  • OpenAI는 내부적으로 강화학습 프로그램을 테스트하기 위해 실시간 전략게임인 도타2 (Dota2) 를 학습한 OpenAI Five를 선보이기도 함
    - 도타2는 빠르게 판단하고 반응해야 승리할 수 있는 상당히 복잡한 게임임에도 불구하 고 OpenAI Five는 나흘간의 경기에서 7,215승 42패 99.4%의 승률을 기록함

³ 제프리 힌튼, 알렉스 크리체프스키, 일리야 수츠케버가 한 팀

⁴  인공지능으로 인류에게 이익을 주는 것을 목표로 하는 미국의 AI 기업. 최근에 ChatGPT, GPT-4 등을 출시

○ 며칠 전 공개된 GPT-4의 경우 이미지까지 처리 가능한 멀티모달(Multi-Modal)⁵을 도입하여 세상 을 조금 더 자세히, 그리고 깊게 이해할 수 있도록 설계

 

  • 시각적인 정보로 세상을 배우면 텍스트로 얻기 힘든 더 많은 것을 학습할 수 있으며, 비디오 정보를 학습하면 그 성능이 비약적으로 향상됨을 경험
    - 세상은 시각적인 정보로 채워져 있으며, 인간도 감각의 1/3 가량을 시각에 의존한다는 점에서 시각 정보는 데이터 측면에서 매우 중요
    - 인간은 평생동안 약 10억 개의 단어만을 듣게 됨. 즉, 시각에서 더욱 더 많은 정보를 습득하고 배우는 것
    - 시각적으로 커뮤니케이션 할 수 있다는 것은 매우 강력한 결과를 가져올 수 있는데, 가 령 별도의 설명없이 도표(다이어그램)를 보여주고 설명을 요청할 수도 있을 것 
  • GPT-4를 ChatGPT와 비교해볼 때 가장 큰 차이점은 GPT-4가 다음에 올 단어를 더욱 정 확하게 예측한다는 점임. 즉 더 나은 신경망을 가지고 있다는 뜻
    - 예를 들어 추리소설을 읽는다고 했을 때, 복잡한 스토리와 입체적인 등장인물, 명확하 지 않은 단서들로 풀기 어려워 보이던 사건이 최종장으로 넘어가면 사건이 낱낱이 이 해됨과 동시에 단 한 명의 범인으로 “예측”되곤 함
    - 이와 같이 다음 단어를 잘 “예측”한다는 것은 상황에 대한 이해도가 높아진다는 뜻과 같다고 볼 수 있음
  • GPT-4의 추론 능력은 아직 명확하게 정의하기 어려우며, 아직은 개발 단계로 봐야함.
    - 현재 선보인 GPT-4는 단순히 ‘성능 좋은 다음 단어 예측기’ 일뿐임. 하지만 이미지를 인식할 수 있고, 다양한 미세 조정으로 더 나은 결과값을 도출해낼 수 있음
    - GPT-4는 객관화된 SAT나 GRE 점수를 통해 매우 높은 성능임을 증명해냈지만, 우리 는 아직 그 잠재력을 완전히 활용하지 못하고 있음
    - 게다가 아직은 할루시네이션(Hallucination:환각)을 보는 것처럼 부정확한 답변 혹은 실제 존재 하지 내용에 관해 답변을 할 때도 있음. 하지만 더 많은 연구와 학습을 통해 세상을 더 많이 이해한다면 충분히 해결 가능할 것으로 믿고 있음

⁵  텍스트만이 아닌 이미지나 소리, 영상도 인식하고 학습 및 처리하는 언어모델 

○ 언어모델은 예측이 어렵고 속도가 빠른 영역이긴 하지만 또한 가장 흥미로운 영역이기도 함

 

  • 기술적 진보는 계속될 것이며, 그 진보를 통해 우리는 계속적인 탄성을 자아낼 것
    - GPT-4는 (완벽하지는 않지만) 사용자가 제시한 단어로 시작하는 시를 만들 수 있고, 인 터넷에 떠도는 밈(Meme)⁶을 보여주면 왜 그 밈이 재미있는지 설명도 가능함
    - 우리는 앞으로 인공지능이 더욱 더 신뢰성 높은 대답을 할 수 있도록 개선하는데 집중 할 것

참고 - 알렉스넷이 주는 의미

2010년부터 시작된 이미지넷(ImageNet) ILSVRC 는 1,000개가 넘는 카테고리로 분류된 120만 개의 이미지를 인식하여 그 정확도를 겨루는 컴 퓨터 비전 분야의 세계적인 대회.

 

이전까지 이 미지 인식률은 75%를 넘지 못했었으나 2012 년 GPU 기반 딥러닝 기술을 채택한 알렉스넷 (AlexNet)이 80%넘는 인식률로 우승을 차지. 이 후 딥러닝 모델은 꾸준한 발전으로 사람 수준을 뛰어 넘는 97%까지 기록

 

※ 알렉스넷은 제프리 힌튼, 알렉스 크리체프스키, 일리야 수츠케버가 함께 제작

역대 이미지넷 ILSVRC 성적

역대 '이미지넷' 'ILVRC'의 성적을 분류해 봄.

참고: P&FM

⁶ 인터넷 등에서 인기있는 이미지나 영상, 글 

권세환

KB경영연구소

권세환
심경석

KB경영연구소

심경석
김준산

KB경영연구소

김준산
진영리

KB경영연구소

진영리

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

금융용어사전

KB금융그룹의 로고입니다. KB라고 기재되어 있습니다 KB Think

이미지