○ 효과적인 인공지능 구현을 위해 대용량의 데이터를 빠른 속도로 연산을 하는 인공지능 반도체
- (정의) 인공지능 반도체는 학습 및 추론 등 인공지능 서비스 구현에 필요한 대규모의 데이터 처리와 연산을 높은 성능과 에너지 효율로 실행하는 반도체로 인공지능의 핵심 두뇌 역할
– 인공지능 반도체는 기존 컴퓨터의 CPU보다 효율적으로 데이터를 고속으로 처리할 수 있도록 특수하게 설계된 반도체로 대용량 데이터를 고속 병력처리하며 전력 소모 최소화
읽는시간 4분
인공지능 연산에 효율적인 인공지능 반도체
기존 반도체와 인공지능 반도체 비교
자료: SK텔레콤 뉴스룸, KB경영연구소 재구성
인공지능 반도체 발전방향
자료: SK텔레콤 뉴스룸, KB경영연구소 재구성
① CPU 및 GPU(1세대)
– 전통적인 폰 노이만 방식⁸을 따르는 CPU 및 GPU는 범용성 및 낮은 가격, 검증된 기술 등이 장점
– GPU는 연산량이 많은 그래픽 처리 목적의 병력처리 기반 반도체로 딥러닝 등 인공지능 구현에 요구되는 데이터 처리에서 CPU 대비 높은 성능으로 인공지능 발전을 견인
– 다만, 상대적 낮은 에너지 효율 및 폰 노이만 구조에 기반한 낮은 연산 성능으로 chatGPT 학습을 위해서 GPU 2~3만개와 1.28GWh(기가와트시)⁹의 전력 사용을 추정
② FPGA 및 ASIC(2세대)
– (FPGA) 하드웨어를 재설계 하지 않고 용도에 맞게 회로를 재구성 할 수 있는 반도체로 사용 목적에 따라 높은 유연성을 가지는 특징으로 최근 인공지능 구현 기술로 주목
– (ASIC) 특정용도를 위해 제작되는 주문형 반도체를 말하며, 최근 인공지능 알고리즘을 효율적으로 구동할 수 있는 NPU(Neural Process Unit, 신경망처리장치) 등이 출현
③ 뉴로모픽(3세대)
– 전통적인 폰 노이만 구조를 벗어나 인간의 뇌를 모방해 연산 및 데이터 저장, 통신 기능을 융합해 인공지능 반도체 중 가장 높은 연산속도와 에너지 효율을 보이는 가장 진화된 형태의 기술
⁵ GPU(Graphics Processing Unit): 그래픽 처리에 특화된 연산기와 내부구조를 가진 프로세서
⁶ FPGA(Field Programmable Gate Array): 하드웨어를 바꾸지 않고 프로그래밍을 통해 사용자 설계에 맞게 구현이 가능한 반도체
⁷ ASIC(Application Specific Integrated Circuit): 특정 기능이나 응용을 위해 주문 제작되는 프로세서
⁸ 프로그램을 내장하며 저장장치와 메모리, 프로세서를 나눠 데이터의 처리와 저장을 분리한 구조로 인해 데이터의 전송과 처리에 병목현상이 생김
⁹ 미국 가정 120곳이 1년 동안 사용하는 전기량과 비슷하며, 이산화탄소 배출량은 미국 자동차 110대가 1년에 배출하는 양과 맞먹는 수준인 502톤으로 환산
폰 노이만 구조의 데이터 병목현상 개요
자료: 관련자료 종합
인공지능 반도체의 주요 특성 비교
자료: 정보통신기술진흥센터
인공지능 반도체 종류별 주요 특성
자료: 관련자료 종합
목적에 따른 인공지능 반도체의 구분
¹⁰ 학습용 하드웨어는 높은 Throughput을 달성할 수 있도록 큰 연산량의 인공지능 반도체(GPU, ASIC)와 이를 뒷받침하는 고성능 메모리로 구성
¹¹ 추론용은 Latency 단축을 위해 학습용 보다 작은 단위의 인공지능 반도체를 사용하며 동일 시간에 처리할 수 있는 연산량이 학습용보다 작기 때문에 메모리에서 공급받을 데이터 양도 적어서 학습용보다 대역폭(Bandwidth)이 작고 저련한 메모리를 사용
인공지능 학습과 추론의 연산 차이
자료: 관련자료 종합
클라우드 컴퓨팅과 엣지 컴퓨팅의 연산작업 위치 차이 비교
자료: XENOSTACK, SK텔레콤 뉴스룸
인공지능 반도체 시장 변화
인공지능 반도체 시장규모 전망
자료: Gartner(’24년 이후는 KISDI전망)
뉴로모픽 반도체 시장규모 전망
자료: Research & market, IITP
데이터센터의 인공지능 반도체별 비중
자료: McKinsey
엣지 디바이스의 인공지능 반도체별 비중
자료: McKinsey
KB경영연구소
금융용어사전