3화. 인공지능의 작동 방식

인공지능은 인간지능을 초월할 수 있을까
시리즈 총 6화
2023.06.13

읽는시간 4

0
내가 꼭두각시를 조각하고, 줄을 조작하지만, 일단 무대에 서면 쇼는 꼭두각시의 것이다.

가이 데이븐포트(Guy Davenport), 미국 저술가

인공지능의 계산은 변수 간의 수식으로 이루어짐

인공지능(컴퓨터)의 변수는 명확한 하나의 값으로 지정되며, 모호한 상황을 표현하기 위해서는 모호한 상황을 나타내는 확률과 통계 수식을 이용하여 계산하여야 함
 
  • 변수는 기본적으로 하나의 값으로 지정되며, 모호한 경계가 존재하지 않음
     - 컴퓨터에서 단어 ‘의자’는 의자일 뿐이며 학교 의자, 소파, 난간 그 어느 것도 될 수 없음
     - 소파를 나타내기 위해서는 ‘소파’라는 단어를 새로 입력하거나, ‘푹신한’ 의자라는 설명 변수를 지정해주어야 함
 
  • 따라서 컴퓨터가 모호한 상황을 처리하기 위해서는 확률과 통계라는 모호한 상황을 계산해주는 수식에 의존해야 함
     - 의자가 푹신할 경우 소파일 확률 90%, 딱딱할 경우 학교 의자일 확률 30% 같은 방식으로 계산을 처리
인공지능은 수식을 이용하여 변수 간의 관계를 찾아내고 이를 다른 계산에 적용
 
  • 개발자들은 인공지능이 모든 데이터를 가장 잘 설명하는 방법을 찾아낼 수 있도록 알고리즘과 최적화 방식을 지정해줌
     - 인공지능은 사전에 주어진 방식에 따라 주어진 데이터를 이용하여 막대한 계산을 수행한 후 최종 결과값(변수들 간의 연결 수식)을 찾아냄
 
  • 인공지능이 찾아낸 최적화 방법은 결국 수많은 변수들을 연결하는 복잡한 수식(확률)
    - 오늘날 가장 널리 사용되는 인공신경망은 행렬을 이용하여 변수들 간에 서로 연결되는 확률을 계산하는 방식
    - 수많은 데이터를 이용하여 인공지능이 변수들 간의 연결 수식(확률)을 찾아내면, 이후 사용자가 특정 단어를 물어볼 경우 계산된 확률을 적용하여 제시된 단어와 높은 확률로 관련된 단어들을 제시

인공지능, 기계학습, 인공신경망의 관계

인공지능, 기계학습, 인공신경망의 관계

자료: KB경영연구소

인간이 설계하는 프로그램의 한계를 극복하기 위해 복잡한 인공지능에 대한 연구가 발전하면서 수많은 변수들 간의 수식을 자동으로 찾아내는 기계학습과 인공신경망이 등장
 
  • 컴퓨터가 주어진 데이터의 특성을 분석하여 원하는 결과를 도출하는 방식을 찾아낼 때까지 지속적으로 학습하는 것을 기계학습이라 함
    - 컴퓨터가 개를 구분하도록 만들기 위해 인간이 생각할 수 있는 다양한 조건들을 프로그램에 입력하는 대신(알고리즘), 수학적 기법을 이용하여 컴퓨터가 개를 인식하는 방법을 찾아내도록 설계(기계학습, machine learning)
 
  • 인공신경망은 인간의 뇌를 본떠 기계학습이 엄청나게 복잡한 구조의 수식을 찾아내도록 만든 프로그램 구현 방식으로, 인간은 그 세부 구조를 이해할 수 없음
     - 인간의 뇌에는 약 1,000억 개의 뉴런이 있으며, 각 뉴런은 수많은 가지를 뻗어 다른 뉴런과 연결되어 있음: 뉴런끼리 연결된 부분을 시냅스라고 하며, 인간 뇌에는 약 100조 개 이상의 시냅스가 있는 것으로 추정
     - 이와 비슷하게, 인공신경망도 데이터를 분석하는 데 있어 특정 영역만을 분석하는 서로 다른 수많은 작은 수식(프로그램 노드)을 복잡하게 상호 연결하여(레이어) 복잡한 데이터를 파악할 수 있도록 만든 거대한 계산 수식에 해당: 인공지능의 매개변수⁶개수는 자연어 생성기인 오픈AI의 챗GPT(GPT-3)가 1,750억 개⁷, 구글의 람다 1,370억 개, 엔비디아의 메가트론-튜링 5,300억 개, 베이징 인공지능아카데미의 우다오(WuDao)가 1조 7,500개 수준이며, 그림 생성기인 오픈AI의 달리1은 120억 개, 달리2는 35억 개 수준
     - 최근에는 슈퍼컴퓨터를 이용해 100조 개 이상의 매개변수를 가진 인공지능도 개발 중

 

  • 인간은 1·2차방정식, 간단한 연립방정식에 대해 풀이 과정을 이해하고 답을 구한다면, 인공신경망은 고차 연립방정식에 대해 무수한 계산을 통해 정답의 근사치를 찾아냄
     - 인간은 x² – 3 = 0을 해법을 통해 풀어내어 ±√3이라는 값을 도출하고, 그것이 왜 정답인지 알려줄 수 있음
     - 인공지능은 x에 -100부터 100까지 0.001 단위로 값을 넣어서 가장 비슷한 값 ±1.732을 구해내지만, 그것이 왜 정답인지 알려주지 못하는 것과 유사⁸

쥐 대뇌 피질의 뉴런

쥐 대뇌 피질의 뉴런의 모습을 보여주고 있다. 초록색 선 부분이 뉴런이다.

자료: Wei-Chung Lee et al. (2006). “Dynamic Remodeling of Dendritic Arbors in GABAergic Interneurons of Adult Cortex,” PLoS Biology.

⁶ 변수(단어)와 변수(단어)의 관계를 나타내는 확률값을 저장하는 변수에 해당
⁷ 매개변수 하나당 2바이트(16비트)의 정보량을 갖는다고 가정하면, 십억 개는 2기가바이트의 정보량에 해당하며, 천억 단위의 매개변수는 200기가바이트 정도의 저장 용량이면 충분히 충당할 수 있음. 이러한 매개변수를 찾아내기 위해서는 수많은 계산과 데이터가 필요하기 때문에 컴퓨터의 저장 및 계산 용량이 더욱 커져야 함(따라서 인공지능 하나를 개발하기 위해서는 막대한 자금이 소요). 하지만 일단 계산이 완료되면 훨씬 용량이 적게 소요되는 계산 결과값만 이용하여 편리하게 인공지능을 이용할 수 있음
⁸ 인공지능이 2차방정식의 해법은 찾아줄 수 있겠지만, 인공지능도 일반해(풀이 방법)가 없는 5차방정식의 정답이 왜 정답인지는 알려줄 수 없음.

계산의 본질은 방대한 자료를 이용한 내삽: 초월적 계산 능력으로 수식 산출

내삽이란 경험한 영역 내에서 가장 잘 맞는 행동 양식을 찾아내 적용하는 것

  • 장마철에는 언제든 갑자기 폭우가 쏟아질 수 있음
 
  • 따라서 장마철에는 당장 해가 떠 있어도 우산을 들고 다니는 것이 도움이 됨
인간이 축적한 방대한 데이터를 모두 이용할 수 있는 컴퓨터는 모든 데이터에 가장 잘 맞는 행동 양식(수식)을 내삽을 통해 계산해냄
 
  • 대화형 인공지능인 챗GPT에 사용된 GPT-3는 문서 8백만 개, 단어 100억 개에 이르는 데이터를 기반으로 학습
     - 개별 인간이 불과 수천 권의 책을 바탕으로 외삽을 통해 세계관을 구축한다면, 인공지능은 문서 수백만 개를 바탕으로 내삽을 통해 세계를 설명하는 수식을 구축
 
  • 그림 생성 인공지능 달리는 1,200만 장의 그림을 기반으로 학습
     - 인간이 하루에 8시간 동안 1분에 한 장씩 그림을 보면 80년간 볼 수 있는 그림의 수는 1,400만 장에 해당
     - 인공지능은 인간이 평생 걸려서도 볼 수 없는 그림을 바탕으로 내삽을 통해 비슷한 그림을 그려내는 수식을 산출함
 
  • 인공신경망은 수백 차원의 연립방정식 수천만 개를 계산하여 풀어내는 것과 비슷하기 때문에, 인간에 비해 데이터를 더 잘 설명하는 수식을 계산해낼 수 있음
    - 인간이 고차원적 사고를 바탕으로 최적의 수를 찾아내는 바둑을 인공신경망은 강력한 계산 능력을 바탕으로 수백 차원의 연립방정식을 풀어내는 문제로 바꿈으로써 인간을 압도
    - 향후에도 인공신경망을 활용하여 인간이 쉽게 풀어낼 수 없는 복잡한 문제에 대한 해법을 찾아낼 가능성이 커지고 있음
 
  • 설계 범위를 벗어나는 영역(외삽)에 대한 인공지능의 답변은 신뢰성 문제가 발생
    - 이는 인공지능의 한계가 아니라 기본적으로 인간의 외삽도 틀릴 가능성이 존재하기 때문에 발생하는 문제
    - 인간은 자신들에 대해 언제나 틀릴 가능성을 인지하지만, 인공지능의 답변에 대해서는 이 부분이 외삽인지 아닌지 판단하기 어렵고, 자신들의 신뢰도가 높아 틀릴 가능성을 인지하지 못할 가능성이 높음

범위를 벗어나는 답변의 신뢰성 문제

설계 범위를 벗어나는 영역(외삽)에 대한 인공지능의 답변 신뢰성의 문제를 그래프로 보여주고 있다. 내삽에서도 '과도한 최적화(overfitting, 과적합)'는 문제를 발생시킬 수 있다.

김진성

KB경영연구소

김진성

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

이미지