4화. 최근 주요 인공지능의 성과와 한계

인공지능은 인간지능을 초월할 수 있을까
시리즈 총 6화
2023.06.13

읽는시간 4

0
로봇이 빈 캔버스를 아름다운 걸작으로 바꿀 수 있어?

영화 <아이, 로봇(I, Robot)> 중

주요 인공지능의 설계 원리와 한계

무언가를 모방하는 데는 크게 두 가지 방법이 있음

  • 하나는 원리를 이해하고 이를 적용하는 것. 다른 하나는 원리를 모를 경우, 기존의 것과 비슷한 결과가 나오도록 다양한 경우를 검토하는 것
IBM의 왓슨은 사고 원리인 논리 모형(가설 수립, 증거 검색, 증거 비교)에 따라 답변을 제공하는 질의응답 인공지능
 
  • 왓슨은 2011년 미국의 TV 퀴즈쇼 <제퍼디(Jeopardy)>에서 인간들을 압도하며 승리하는 등, 질문에 대한 답변을 매우 훌륭하게 생성
 
  • 그러나 인간의 사고 과정 자체가 완전히 밝혀지지 않았기 때문에 왓슨의 논리 모형이 인간의 사고를 제대로 반영한다는 보장이 없음
 
  • 가설 수립, 증거 검색, 증거 비교 진행 단계는 인간의 사고와 비슷하지만, 인간이 가설을 세우는 과정(유추 등)에 대해서는 명확히 알려진 바가 없음

TV 퀴즈쇼 <제퍼디>에 출연한 인공지능 왓슨

'TV 퀴즈쇼 제퍼디'에 출연한 '인공지능 왓슨'을 보여주고 있다. 왓슨은 인간들을 압도하며 승리하는 등, 질문에 대한 답변을 매우 훌륭하게 생성하였다.

자료: Methodshop.com

대화형 인공지능(인공신경망) 챗GPT는 논리가 아닌 확률에 의해 가장 비슷한 답변을 채택하는 것(결과 모방)이므로 인간의 사고와 근본적으로 차이
 
  • 오픈AI의 챗GPT는 일반적인 상식에 대해 매우 충실하고 훌륭한 답변을 뛰어난 글 구조와 완벽한 문법으로 생성
 
  • 그러나 실제 챗GPT는 삼단논법 같은 논리 문제에서 쉽게 틀리는 현상 발생
 
  • 확률에 기반한 대화형 인공지능에 다른 기법들을 적용하여 인간의 추론을 비슷하게 따라 하는 연구도 지속되고 있음
그림 생성 인공지능 달리는 주제어와 그림 패턴을 연관시켜 주제어에 맞는 그림 패턴을 생성하는 것으로, 단순히 사물을 흉내내어 그리는 수준을 벗어나기 어려움
 
  • 오픈AI의 달리는 다양한 사물의 형태를 구체적으로 묘사하면 그에 부합하는 훌륭한 그림을 원하는 화풍으로 그려 줌
 
  • 그러나 원근법, 구도, 소품의 의미, 색상의 배치 등 작가의 의도가 그림 전체를 관통하여 그림에 녹아드는 방법은 아직 구현되지 않고 있음
 
  • 단순히 사물을 모방하여 그리는 것이 아닌, 주제와 구도 등에 대한 정보를 어떻게 수식화할 것인가에 대한 지속적인 고민이 필요

왓슨: IBM이 개발한 질의응답 인공지능

왓슨은 자연어(인간의 언어) 질문을 이해하고 그에 맞는 답변을 자료에서 검색하여 제공하는 질의응답 인공지능
 
  • 1997년 체스 챔피언을 이긴 IBM은 TV 퀴즈쇼 <제퍼디>를 보고 영감을 얻어 질문에 응답하는 인공지능 개발에 착수
 
  • 2005년부터 개발에 들어간 왓슨은 2011년 TV 퀴즈쇼 <제퍼디>에 참가하여 기존 74회 우승한 참가자 등을 압도적인 격차로 승리함
퀴즈쇼 대결로 기존의 지식을 활용하여 답안을 성공적으로 생성하는 것이 입증되면서, 왓슨은 여러 분야에 시험 적용되었으나 그 성과는 크지 않음
 
  • 2016년에서 2017년 국내 일부 병원에 IBM 왓슨이 암 진단 보조 도구로 도입되었으나, 성과가 그다지 좋지 않아 대부분 계약 해지됨⁹
    - 환자 정보를 여러 정보 시스템에서 자동으로 취득하는 대신 의사가 직접 적은 자연어 의무 기록(차트 정보)을 습득하는 과정에서 문제가 발생
    - 중요한 증상에 대한 진단이 의사결정을 위한 입력 정보 중 하나로 취급되는 등 제한된 정보를 기반으로 전체 상황에 대한 추론은 불가능하고, 의사들이 포착하는 미세 증상 감지 능력도 부재
    - 중요 상황에 대한 대응법 및 결정 방안에 대한 몰이해로 가이드라인 이상의 해법은 제시하지 못함
    - 길병원 대장암 환자 656명에 대한 왓슨의 암 진단 일치율은 49%에 불과
 
  • IBM은 2022년 왓슨 헬스 부문의 매각 발표
현재는 복잡한 현상을 파악하여 답변을 제공하는 분석 도구보다는 자연어 인식에 기반한 고객 맞춤형 상담에 주로 활용되고 있음
 
  • GM의 자동차금융 자회사 GM파이낸셜의 챗봇, 독일 항공사 루프트한자의 고객 맞춤형 광고, 미국 페인트회사 베어페인트(BEHR)의 일대일 고객 상담 활용, 글로벌 회계법인 언스트앤영(EY)의 고객 상담 활용 등

⁹ “AI의사로 주목받았던 ‘왓슨’은 왜 잊혀졌나,” Medi: Gate News, 2021년 9월 2일

챗GPT: 오픈AI가 개발한 대화형 인공지능

챗GPT는 인간이 입력한 자연어를 인식하고 그에 걸맞은 응답을 제시하여 대화할 수 있는 인공지능
 
  • 2017년 구글에서 자연어 처리를 위한 ‘변환기(transformer)’ 아이디어를 제시하면서 자연어 처리 인공지능이 본격적으로 발전
 
  • GPT(Generative Pre-trained Transformer, 생성형 사전학습 변환기)는 문장이나 문서 전체의 구조에서 단어들 간의 관계를 파악하는 기법으로, 기존과 비교해 맥락에 대한 이해도가 비약적으로 향상
 
  • 오픈AI의 챗GPT는 GPT-3.5 버전을 기반으로 2022년 11월 공개되었으며, 인공지능 시장이 한 단계 도약하는 계기가 됨
챗GPT는 학습한 방대한 문서를 기반으로 쌓은 다양한 분야의 지식을 완벽한 문법으로 제공하기 때문에 인간과 유려한 대화가 가능하지만, 사실 관계에서는 부족함이 드러나고 있음
 
  • GPT의 핵심 기술은 언어의 형식(단어나 형태소의 위치와 단어들 간의 관계 등)을 다루는 것으로, 말하는 내용의 진실성과는 무관함
 
  • 챗GPT로 생성되는 모든 답안은 학습된 기존 지식을 가장 매끄러운 형태로 기술하는 것일 뿐, 사실 여부는 전혀 고려되지 않음
 
  • 다만 학습된 자료의 상당 부분이 진실한 것이기 때문에, 대부분 사실과 부합한 내용을 아주 훌륭한 형태로 제공할 수 있음
     - GPT는 학습된 자료를 기반으로 답변하기 때문에 학습된 내용 이후의 뉴스는 반영하지 못하는 문제가 발생하며, 이는 검색 기반 답변과의 가장 큰 차이점이라 할 수 있음
     - 마이크로소프트의 빙은 인공지능에 검색 결과를 결합하여 최신 뉴스도 반영함

챗GPT 대화 화면

인공지능 '챗GPT'와 대화한 화면을 캡쳐한 것이다. 사용자는 '비가 와서 기분이 우울한데, 뭘 하면 좋을까?'라고 질문하였다.

자료: Chat.openai.com

언어 번역, 교정, 요약 등 언어 자체와 관련된 측면에서는 활용성이 매우 높을 것으로 기대

  • 언어가 아닌 다른 분야에서도 자연어 인식 능력이 매우 뛰어나기 때문에 전문가가 보조 자료 검색용으로 쉽게 활용할 수 있으나, 내용의 사실 검증 과정이 추가로 필요

달리: 오픈AI가 개발한 그림 생성 인공지능

달리는 인간이 묘사한 단어를 기반으로 그에 걸맞은 그림을 그려주는 인공지능

  •  2015년 열역학 아이디어를 이용한 확산 모형(Diffusion Model)이 제시되면서 본격적으로 그림을 분해하여 학습하고, 반대로 이를 복원하여 그림을 그려주는 인공지능 모형이 개발¹⁰
     - 물 위에 잉크를 떨어뜨리면 색소가 퍼져 나가듯, 그림의 모든 부분을 확산 형태로 점차 퍼뜨리면서 형태가 없어지도록 분해
     - 그림이 점차 형태를 잃어가는 과정 자체가 복잡한 수식(함수)으로 계산되어 저장되며, 특정한 사물의 여러 그림을 학습하면서 사물의 수식을 수렴하여 해당 사물의 패턴을 학습하게 됨

 

  • 학습 후 해당 사물을 그릴 것을 명령하면, 임의의 점들을 생성한 후 이 점들로부터 다시 패턴을 반대로 재생하여 특정 사물의 형태를 구성
     - 인간이 그려 달라는 사물과 형태 등의 자연어를 명령어로 전환하는 자연어 인식 기술이 적용됨
     - 임의의 점들을 생성한 후 이를 복원하기 때문에 매번 그림이 미묘하게 달라지게 되지만¹¹, 적용 함수가 동일하므로 처음에 요청한 사물의 주요 특징은 그대로 간직한 그림이 생성됨
 
  • 달리 외에도 잠재 확산 모형을 이용한 ‘스테이블 디퓨전(Stable Diffusion)’과 이를 기반으로 개조한 ‘노벨AI’ 등 여러 그림 생성 인공지능이 공개되어 있음
     - ‘스테이블 디퓨전’은 소스코드가 공개되어 누구나 자유롭게 사용 가능

그림 인공지능에서 확산 모형

'그림 인공지능'에서의 '확산 모형(Diffusion Model)'을 보여주고 있다. 그림 인공지능의 학습과 복원에 대해서 설명하고 있다.

자료: Jascha Sohl-Dickstein et al. (2015).

달리는 방대한 양의 그림을 학습하였기 때문에 거의 모든 화풍으로 거의 모든 사물을 다양하게 조합하여 그릴 수 있으나, 사물을 넘어서는 무언가는 담기 어려움
 
  • 각 그림과 사진의 시대, 작가, 화풍, 그려진 사물, 상황, 자세 등을 자세하게 학습하기 때문에 일반적으로 생각할 수 있는 거의 모든 사물을 다양한 방식으로 그릴 수 있음
 
  • 예상치 못한 사물 간의 조합도 충분히 가능
     - 아보카도 모양의 의자 = 아보카도 + 의자 = 의자의 윗부분을 아보카도로 변경
     - 오토바이를 탄 코알라 = 오토바이 + 코알라 = 오토바이 탑승자를 코알라로 변경
 
  • 그러나 사물을 재구성(복원)하는 디퓨전 모형의 한계로 그림의 구도, 사물의 배치 등 사물을 넘어서는 작가의 의도는 담기 어려움
 
  • 종종 구조가 복잡한 사물의 경우, 재구성 과정에서 이상한 모습으로 그림이 생성되기도 함
     - 손가락 마디마디의 구조가 복잡한 손은 그림 작가도 그리기 어려운 부분에 해당
     - 그림 생성 인공지능은 종종 손가락 6개, 이상하게 꺾인 손가락 등 잘못된 손 모양을 그려 냄

인공지능이 그린 이상한 손 모양

'인공지능'이 그린 이상한 손들을 모아놓은 사진을 게시한 트위터 게시물이다. 텍스트 내용에 '손을 못 그린다고 슬퍼하지 마세요. AI도 못 그려요.'라고 적혀있다.

자료: 트위터

사물에 대한 그림이 필요한 경우, 그림 생성 인공지능은 재빨리 다양한 사물 그림을 그려줄 수 있으며, 작업자는 이를 활용하여 다른 작업을 진행할 수 있음
 
  • 그림 전체에 다양한 의도를 담아내는 고도의 작품 작업은 여전히 전문가의 영역에 해당

¹⁰ Jascha Sohl-Dickstein et al. (2015). “Deep Unsupervised Learning using Nonequilibrium Thermodynamics,” 32nd International Conference on Machine Learning.
¹¹ 기본적으로 확률 분포를 사용하고, 그림을 분해하면서 정보가 소실되기 때문에 학습된 자료와 완전히 똑같이 복원할 수 없음

김진성

KB경영연구소

김진성

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

이미지