(서울=연합인포맥스) 한종화 기자 = KT[030200]가 한국 사회와 문화를 반영한 인공지능(AI) 안전성 평가 기준을 공개했다.
KT는 멀티모달 대형언어모델(MLLM) 벤치마크인 'KSAFE-MM'을 공개했다고 16일 밝혔다.
멀티모달은 텍스트와 이미지, 음성 등 다양한 데이터를 통합 처리하는 시스템을 말한다.
KT와 고려대가 공동 개발한 KSAFE-MM은 글로벌 공통 리스크를 한국 문화 맥락으로 변환한 'KSAFE-MM-G'와 전세 사기, 독도 분쟁과 같은 한국 사회 고유의 이슈를 반영한 'KSAFE-MM-C'로 구성됐다.
KSAFE-MM은 총 1만4천135개의 평가 샘플로 구성됐으며 구글의 젬마와 네이버의 하이퍼클로바 X 등 12개의 AI 모델을 검증했다.
기존 벤치마크는 수동 검수 중심이라 비용이 많이 들고 효율도 높지 않았다.
반면 KSAFE-MM은 민감 주제 수집부터 템플릿 기반 쿼리(사용자가 AI 모델에 입력하는 질문) 생성, 합성 이미지 생성, AI의 안전장치나 윤리 제한을 우회하도록 변형된 '탈옥 쿼리(Jailbreak Query)' 생성까지 전 과정을 아우르는 4단계 자동화 파이프라인을 구현했다.
박재형 KT AX 미래기술원 프론티어 AI랩장은 "안전성 벤치마크의 공개는 단순한 데이터 배포를 넘어 AI 안전성 연구 생태계 전반이 함께 발전할 수 있는 기반을 만드는 일"이라며 "KSAFE-MM이 학계와 산업계에서 한국어·한국 문화 맥락의 AI 안전성을 검증하는 공통 기준으로 자리 잡길 기대한다"고 말했다.
[출처 : KT]
jhhan@yna.co.kr
한종화
jhhan@yna.co.kr
함께 보면 도움이 되는
뉴스를 추천해요
금융용어사전
금융용어사전