2화. 거대언어모델이 불러온 패러다임의 변화

챗GPT 등장이 앞당긴 AI 패러다임 변화
시리즈 총 5화
2023.06.16

읽는시간 4

0

○ 거대언어모델의 발전은 AI 산업에서 ‘파운데이션 모델(Foundation model)’이라 불리는 새로운 패러다임을 제시하고 있음

 

  • 파운데이션 모델이란 방대한 양의 데이터를 ‘자기지도학습(Self-supervised learning)⁸’으로 사전 학습한 일종의 ‘범용적인 인공지능 모델’을 의미
    - 과거에는 다양한 문제를 풀기 위해 각각 서로 다른 알고리즘과 모델을 적용한 반면, 파운데이션 모델은 이용하면 하나의 모델로 광범위한 문제를 해결 가능

    - 또한 파운데이션 모델은 하나의 예시(One-shot learning) 또는 약간의 예시(Few-shot learning)들만으로도 전이학습(파인튜닝과 같은 추가적인 학습)이 가능하여 다양한 산업군에서 보다 쉽게 적용 가능

    - 파운데이션 모델이 보여주는 보편적인 데이터 이해 능력과 대규모 데이터 학습 능력인공지능 생태계를 변화시키고 있으며, 최근 유행 중인 GPT, PaLM 모두 파운데이션모델이라는 점에서 당분간 주류 모델로 자리매김할 것으로 전망

⁸ 정답이 주어지지 않은 데이터, 예를 들어 고양이 사진에 ‘고양이’라는 정답을 입력하지 않은 데이터를 인공지능이 스스로 정의와 규칙을 찾아 분류하는 방식을 말함

파운데이션 모델 개념도

'거대언어모델'의 발전은 AI 산업에서 ‘파운데이션 모델(Foundation model)’이라 불리는 새로운 패러다임을 제시하고 있음.

자료: 스탠퍼드대학교

○ 파운데이션 모델은 그 생태계를 확장하는 방안으로 다양한 서비스를 구축 중에 있으며, 챗 GPT의 경우 서드파티(3rd Party) 플러그인(Plug-Ins}을 지원할 예정

 

  • 오픈AI가 발표한 플러그인이란 챗GPT에서 외부 서비스를 이용할 수 있도록 도와주는 일종의 확장 프로그램으로, 마치 스마트폰 유저가 특정 앱을 다운받아 쇼핑을 하거나, 호텔을 예약하는 것과 비슷한 역할을 수행

챗GPT 플러그인

'오픈AI'가 발표한 '플러그인'이란 '챗GPT'에서 외부 서비스를 이용할 수 있도록 도와주는 일종의 확장 프로그램.

자료: 오픈AI

챗GPT 플러그인 활용 예제

'플러그인'은 마치 스마트폰 유저가 특정 앱을 다운받아 쇼핑을 하거나, 호텔을 예약하는 것과 비슷한 역할을 수행.

자료: 자비에 아마트리아인, Amatriain.net

○ 또한 최근 대기업, 스타트업 가릴 것 없이 GPT 기술을 활용한 다양한 서비스들이 대거 등장하며, 전문가들 사이에 생성형 AI의 춘추전국시대가 활짝 열렸다는 평⁹

 

[모건스탠리] 세계 3대 투자은행 중 하나인 모건스탠리는 GPT 기술을 내부자료 검색용으로 활용하면서 고객 자산관리 영역에서 우위를 점함

- 모건스탠리는 시장조사에서 투자전략까지 자산관리와 관련된 수십만 페이지 분량의 내부 자료들을 PDF 파일로 보관하고 있었으나, 특정 내용을 확인하기 위해 방대한 양의 파일을 일일이 확인해야 하는 불편함이 존재

- 모건스탠리는 이러한 불편함을 개선하기 위해 GPT-4¹⁰ 기술을 도입하였고, 그 결과 콘텐츠 활용도가 향상되고 과거 대비 더욱 신속한 고객 상담이 가능해졌다고 발표¹¹

 

[비마이아이즈(Be My Eyes)] 덴마크 스타트업 비마이아이즈는 전 세계에 50만 명 이상의 시각장애인이나 저시력자들을 위한 도움 서비스를 제공(한국도 지원)

- 비마이아이즈는 도움이 필요한 시각장애인과 자원봉사자를 영상통화로 이어주는 서비스로, 시각장애인이 도움이 필요한 시점과 자원봉사자가 도움을 줄 수 있는 상황이 서로 일대일로 매칭되지 않는 한계를 극복하기 위해 개발

- GPT-4의 멀티모달(Multi Modal)¹² 기능을 활용함으로써 시각장애인이 시간에 구애받지 않고 언제든 사진을 찍어 올리면, AI 자원봉사자가 상황을 이해하고 설명을 해주는 서비스를 추가

 

[아숙업(AskUp)] 국내 AI 스타트업 업스테이지(Upstage)는 GPT-4 기술을 적용한 카카오톡 채널인 아숙업을 런칭

- 아숙업 서비스는 카카오톡에서 간단하게 등록¹³하여 사용할 수 있는 챗봇으로, GPT-4 이외에도 자사의 OCR 기술을 결합하여 이미지 내 텍스트 인식이 가능

- 영어 회화를 연습하거나 음식 성분을 확인할 수 있고, 수학 문제도 사진을 찍어 풀이를 요청할 수 있음

 

[GPT제로(GPTZero)] 에드워드 티안(Edward Tian)이라는 프린스턴대학교 학생이 개발한 AI 텍스트 탐지 서비스로 AI가 쓴 글인지 사람이 쓴 글인지 구분

- GPT제로는 AI를 이용해 보고서나 논문을 작성하는 오용 사례를 막기 위해 개발되었으며, 현재 1백만 명 이상의 사용자가 이용하며 큰 인기를 얻고 있음

⁹ “아마존도 AI대전 합류, 생성형 AI 춘추전국시대, 커지는 韓 위기론,” <머니투데이>, 2023년 5월 16일

¹⁰ 처음에는 GPT-3였으나 현재는 GPT-4를 이용

¹¹ “Key Milestone in Innovation Journey with OpenAI,” Morgan Stanley, Mar 14, 2023.; https://url.kr/jo68ah

¹¹ 시각, 청각을 비롯한 여러 인터페이스를 통해 정보를 주고받는 기능을 말함

¹³ 카카오톡 상단 [검색 아이콘]을 누르고 ‘아숙업’이라는 키워드를 입력하면 친구로 추가 가능(2023년 6월 8일 기준 114만 명이 친구추가 중)

아숙업 활용 예제

국내 'AI 스타트업 업스테이지(Upstage)'는 'GPT-4' 기술을 적용한 카카오톡 채널인 '아숙업'을 런칭.

자료: 아숙업

GPT제로 서비스 화면

'에드워드 티안(Edward Tian)'이라는 프린스턴대학교 학생이 개발한 AI 텍스트 탐지 서비스로 AI가 쓴 글인지 사람이 쓴 글인지 구분.

자료: GPT제로

○ 챗GPT 등장 이후 프롬프트¹⁴ 엔지니어링(Prompt engineering)에 대한 많은 연구가 진행¹⁵되는 한편, 이를 전문적으로 수행하는 프롬프트 엔지니어라는 새로운 직업군도 등장

 

  • 프롬프트 엔지니어링은 AI가 최적의 결과물을 도출할 수 있도록, 같은 내용이더라도 다른 방식으로 프롬프트를 작성하는 것을 의미¹⁶
    - ‘앤스로픽(Anthropic)’이라는 AI 스타트업은 연봉 28만 달러~37.5만 달러(3억7천만 원~5억원) 상당의 프롬프트 엔지니어 채용 공고를 냈으며, ‘PromptBase’, ‘ChatX’ 같은 프롬프트 마켓 플레이스도 생겨나고 있음

 

  • 그러나 프롬프트 엔지니어라는 직군이 지속가능할 것인가에 대해서는 다소 회의적
    - 프롬프트 엔지니어가 하는 일은 크게 ▲최소한의 비용으로 최대한 효율적인 답변을 얻는 기술 ▲기업 내부 데이터를 추가적으로 학습시키는 파인튜닝(fine-tuning)으로 나눌 수 있는데, 이는 경험적인 노하우가 중요한 영역

    - 초기에는 빠른 기술 습득 및 서비스 론칭 등을 위해 전문가의 도움이 필요할 수 있으나, 향후 일반 사용자들이 경험 축적을 통해 역량이 향상되는 시점이 되면 프롬프트 엔지니어 직군이 사라질 가능성도 있음(이미 프롬프트 엔지니어링을 도와주는 소프트웨어도 출시되기 시작)

 

○ 아울러 최근 구글에서는 AI 챗봇인 바드(Bard)를 공개하며 챗GPT 독주를 견제

 

  • 구글은 2023년 구글 연례개발자회의(Google I/O)¹⁷에서 과학 및 수학을 주제로 한 광범위한 학습으로 논리와 추론 능력을 대폭 강화한 PaLM2라는 새로운 모델을 소개하며 이를 ‘바드’에 적용했다고 발표¹⁸
    - 특히 ‘바드’의 전 세계 180개국 론칭을 공개하며 영어만을 지원했던 기존 모델과 달리 추가 지원 언어로 한국어와 일본어를 선택했다고 발표¹⁹하여 시장에 큰 반향을 불러일으킴

    - PaLM2 역시 파인튜닝으로 도메인²⁰별 추가 학습이 가능하며, 정보보안 관련 데이터를 학습한 Sec-PaLM2, 의학 데이터를 학습한 Med-PaLM2 등도 출시

 

  • 실제 구글은 지난 2월 챗GPT 열풍에 대항하기 위해 급하게 ‘바드’를 공개 시연했다가 특정 질문에 틀린 답변을 내놓은 것이 알려져 AI 성능의 신뢰도에 큰 우려를 낳았으며, 모회사인 알파벳의 시가총액이 하루 새 133조 원이 폭락하는 해프닝도 발생
 
  • 하지만 ‘바드’의 기반 모델을 LaMDA에서 PaLM2로 교체한 이후에는 성능에 대한 긍정적 평가가 주를 이루면서, 챗GPT의 대항마로 급부상하고 있다는 평
    - 또한 챗GPT는 실시간 정보에 대한 답변을 하지 못하는 데 반해, ‘바드’는 실시간으로 인터넷 정보를 가져올 수 있다는 점에서 차별화된다 강점이 있다는 의견이 다수

¹⁴ 원래 DOS 시스템에서 사용자의 명령을 받아들일 준비가 되었음을 모니터에 나타내는 표시로 입력을 기다리는 깜박이는 커서를 의미하였으나, 생성형 AI 분야에서 거대언어모델에 던지는 질문, 즉 입력값을 의미

¹⁵ 프롬프트 사용법에 대한 정보 공유 사이트(https://github.com/openai/openai-cookbook/)

¹⁶ 보다 우수한 품질의 응답을 받기 위해서는 해당 언어모델이 쉽게 이해할 수 있는 정제된 언어로 구조화된 프롬프트를 구성하는 것이 중요(“챗GPT를 비롯한 대화형 AI 서비스에서 더 좋은 결과물을 얻게 해주는 프롬프트 엔지니어링,” seongjin.me)

¹⁷ Input/Output, Innovation in the Open, 미국 샌프란시스코에서 매년 열리는 구글의 개발자 대상의 글로벌 콘퍼런스를 말함

¹⁸ “Introducing PaLM2,” blog.google, May 10, 2023.

¹⁹ 그 이유로 ▲최신 기술에 민감하게 반응하고 피드백이 빠른 시장을 공략하기 위함이라는 해석 ▲기존 영어와 문법적으로 가장 큰 차이를 보이는 언어를 우선적으로 테스트했다는 해석 ▲미국, 중국, 이스라엘, 한국 등 거대언어모델을 보유한 국가가 많지 않아 AI 영향력을 더욱 확대하기 위해서라는 해석 등이 공존

²⁰ 속성이 정의된 조건을 만족시키는 값의 범위 또는 범주를 말함

자연어 처리(NLP) 주요 서비스 및 모델

‘바드’의 기반 모델을 'LaMDA'에서 'PaLM2'로 교체한 이후에는 성능에 대한 긍정적 평가가 주를 이루면서, '챗GPT'의 대항마로 급부상하고 있다는 평.

자료: 연구자 재구성

챗GPTvs 바드 특징 비교

'챗GPT'는 실시간 정보에 대한 답변을 하지 못하는 데 반해, ‘바드’는 실시간으로 인터넷 정보를 가져올 수 있다는 점에서 차별화된다 강점이 있다는 의견이 다수.

자료: 각 사 홈페이지

김진욱

KB경영연구소

김진욱
권세환

KB경영연구소

권세환

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

이미지