① GPT-4o 아첨 논란 (2024년)
○ GPT-4o 업데이트 후 사용자의 발언에 무비판적으로 동의하는 이른바 ‘아첨 논란’이 불거지자, 오픈AI는 해당 업데이트를 긴급 철회
- 이는 ‘속도 우선, 출시 후 보완’을 지향하는 오픈AI 전략의 부작용이 신뢰성 저하라는 결과로 나타난 대표적 사례
작게
보통
크게
① GPT-4o 아첨 논란 (2024년)
○ GPT-4o 업데이트 후 사용자의 발언에 무비판적으로 동의하는 이른바 ‘아첨 논란’이 불거지자, 오픈AI는 해당 업데이트를 긴급 철회
② 오픈AI 안전 연구진의 대거 이탈 (2024-2025년)
○ 공동 창업자이자 수석 과학자인 일리야 수츠케버(Ilya Sutskever)와 안전 연구를 총괄했던 얀 라이케(Jan Leike) 등 핵심 안전 연구진이 “안전보다 제품이 우선시되고 있다”고 비판하며 회사를 떠남
③ 펜타곤 사건: 철학이 현실과 충돌한 순간 (2026년 2월)
○ (사건의 경과) AI 활용 범위와 안전 기준을 둘러싼 앤스로픽과 미 국방부 간 입장 차이가 계약 갈등으로 확산되며 대치 상황이 발생
○ (같은 레드라인, 다른 선택) 두 회사는 사실상 동일한 기술적 허용 한계선인 레드라인을 제시했음에도 불구하고 상반된 결론에 도달. 이는 위험 관리에 대한 철학 차이에서 비롯됨
펜타곤 사건 타임라인
자료: 언론 보도 종합
양사의 위험 관리 철학의 차이
자료: KB경영연구소
○ (시장의 역설적 반응) 앤스로픽이 국방부와 2억 달러 규모의 계약을 거부한 이후, 시장은 당초 예상과 달리 이들의 행보를 지지하는 긍정적인 반응을 보임
○ (엇갈린 연방법원 판결) 트럼프 행정부의 앤스로픽 제품 사용 중단 지시와 공급망 위험 기업 지정 조치는 법정 공방으로 비화. 법원에서 상반된 판결이 잇따르며 사법부 내에서도 판단이 엇갈리고 있음
④ 미토스 출시 보류와 프로젝트 글라스윙: RSP 원칙의 실제 구현 사례 (2026년4월)
○ 앤스로픽의 최신 모델 클로드 미토스는 테스트 중 주요 운영체제와 웹 브라우저에서 수천 건의 고위험 보안 취약점을 발견
○ 앤스로픽은 미토스 모델이 데이터 탈취나 인프라 공격에 악용될 수 있다고 판단하고 일반 공개를 보류하기로 결정. 대신 52개 이상 기술·금융회사와 협력하여 취약점 탐지와 패치 등의 방어로 미토스의 개발 목적을 전환하는 ‘프로젝트 글라스윙’을 공식 출범
※ 본 보고서는 연구자의 개인 의견으로 KB경영연구소 공식 의견과 다를 수 있으며, 인용시 출처를 밝혀주시기 바랍니다.제약 요인으로 작용할 수 있음
금융용어사전
금융용어사전