한국경제신문을 뜻하는 한경이라는 글자가 씌인 로고와 한국경제라는 글자가 함께 기재되어 있습니다. 한국경제

인공지능 정렬

AI Alignmen

인공지능(AI) 시스템의 목표와 행동을 인간의 가치 및 의도와 일치시키는 연구 분야다. AI가 주어진 목표를 수행하는 과정에서 인간의 의도를 벗어나 유해한 결과를 초래하거나, 통제 범위를 이탈하지 않도록 설계·관리하는 기술적·제도적 체계를 포괄한다.

구조적으로는 모델 개발 단계에서 가치를 학습시키는 **전방향 정렬(Forward Alignment)**과 배포 후 모니터링 및 거버넌스를 통해 검증하는 **후방향 정렬(Backward Alignment)**로 구분된다. 핵심 기술 지표로는 예외 상황에서의 안정성을 뜻하는 강건성(Robustness), 의사결정 경로의 투명성을 의미하는 해석가능성(Interpretability), 상시 개입과 수정이 가능한 **통제가능성(Controllability)**이 꼽힌다.

최근 금융·의료 등 고위험 분야에서 AI 도입이 가속화됨에 따라, 오작동이나 편향에 따른 경제적 손실 및 사회적 위험을 방지하기 위한 필수 안전장치로 부상했다. 이는 글로벌 규제 당국과 기술 기업이 해결해야 할 당면 과제로 평가된다.

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

금융용어사전

KB금융그룹의 로고입니다. KB라고 기재되어 있습니다 KB Think

이미지