DeepSeek V4 충격은 없었지만 중국 면역력이 높은 On-device AI 시장이 주목받기 시작할 전망

Global Insights
26.04.27.
읽는시간 2분

퀵하게 보기

  • LLM 분야에서 중국의 추격을 뿌리치기 위해 달리는 사이, Physical AI에서 주도권을 놓칠 수 있는 미국
■ LLM 분야에서 중국의 추격을 뿌리치기 위해 달리는 사이, Physical AI에서 주도권을 놓칠 수 있는 미국

높은 성능, 뛰어난 가격 경쟁력, 무엇보다 미국 의존을 낮출 수 있다는 걸 보여준 DeepSeek V4.
지난주 금요일, DeepSeek이 V4 모델을 공개.
1.6조 개의 파라미터를 가진 Pro 모델과 2,840억 개의 파라미터를 가진 Flash 모델로 출시.
1) 성능.
미국의 주요 프론티어 모델에 꽤 근접한 벤치마크 점수를 보여줌.
AI가 코딩 도구로 활용되면서 최근에 가장 주목받는 SWE-Bench Verified가 80.6을 기록.
Claude Opus 4.6 Max의 80.8과 Gemini 3.1 Pro High의 80.6과 비등한 성과를 보여줌.
GDPVal-AA 점수는 1,554를 기록하면서 오픈소스 모델로는 가장 높은 점수를 기록.
그 외 MMLU-Pro, GPQA Diamond, HLE 등 지식/추론 분야 벤치마크에서도 미국 프론티어 모델과 비슷한 점수를 냈고, MRCR 1M, CiroysQA 1M처럼 장기 컨텍스트 처리 능력도 Claude에 비해서는 조금 낮았지만 Gemini에 비해서는 높은 점수를 보여줌.
DeepSeek은, V4가 GPT-5.4와 Gemini 3.1 Pro에 약간 미치지 못하고, 미국 프론티어 모델 대비 약 3~6개월 뒤처진 발전 궤적을 시사한다고 인정.
2) 가격.
하지만 가격까지 고려하면, 압도적인 가격 대비 성능비를 보여줌.
V4 Pro는 입력 100만 토큰 기준으로 1.74달러, 출력은 3.48달러.
V4 Flash는 입력 0.14달러, 출력 0.28달러.
최근 GPT-5.5가 입력 5달러, 출력 30달러로 GPT-5.4에 비해 가격이 2배 인상되는 등, AI 인프라 투자 비용이 늘고 전력 비용이 상승하면서 미국 프론티어 모델의 AI 모델 요금이 상승하는 것과 비교하면, DeepSeek V4는 매우 큰 경쟁력을 갖고 있음.
심지어 GPT-5.5 Pro는 입력 30달러, 출력 180달러로 중국 모델과의 격차가 매우 큼.
미국 모델에 비해 중국 모델이 특정 업무를 수행할 때 토큰 생성량 (token-per-task)이 많아서, 격차가 이 정도로 벌어지지는 않음.
하지만 Analysis Intelligence Index를 실행하는 데 Claude Opus 4.7은 4,811달러가 들었던 것과 비교하면, 1,071달러가 든 V4 Pro의 가격 경쟁력은 매우 높음.
3) 반도체.
미국에게 위협이 되는 건, DeepSeek V4가 화웨이 어센드 (Ascend)로 학습됐다는 점.
미국의 반도체 수출 통제가 중국에게 위협이 되는 건 맞지만, 결정타를 입히지는 못하고 있다는 걸 보여줌.
그렇다고 미국이 중국에 반도체 수출을 허가할 수는 없겠지만, 미중 정상회담을 앞두고 미국이 중국을 압박하는 카드의 유효성이 낮아졌다는 건 미국의 협상력을 떨어뜨리는 요소.
미국은 이란과의 전쟁에서 엄청난 무기를 소진한 만큼 무기 재고를 채우기 위해 희토류가 필요한 상황이고 (3/31), 중간선거를 앞두고 농산물과 에너지 수입 확대도 요청해야 하는 만큼, 줄 건 없고 받을 건 많아서 협상력이 크게 약해진 미국이 정상간 만남을 회피할 가능성은 여전히 높음

작게

보통

크게

0

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

금융용어사전

KB금융그룹의 로고입니다. KB라고 기재되어 있습니다 KB Think

이미지