○ 【배경】 AI의 답변에 특정 브랜드가 포함될 지 여부는 마케터의 의도보다 AI의 판단 기준에 의해 결정되며, 그 기준은 데이터를 처리하고 의미를 해석하는 기술적 메커니즘에 의해 작동
- 따라서 어떤 형태의 정보가 ‘읽히는 콘텐츠’이고 그들의 판단 과정에 작동하는 기술적 요소와 역할은 무엇인지에 대한 이해가 필요
작게
보통
크게
○ 【배경】 AI의 답변에 특정 브랜드가 포함될 지 여부는 마케터의 의도보다 AI의 판단 기준에 의해 결정되며, 그 기준은 데이터를 처리하고 의미를 해석하는 기술적 메커니즘에 의해 작동
○ 【개념】 AI는 단어와 문장을 다차원 공간의 숫자 배열(벡터)로 변환. 이때 단순 키워드 매칭에 그치지 않고 의미론적 유사성을 기반으로 사용자의 질문 의도와 정보 사이의 ‘의미적 거리’를 계산해 맥락에 부합하는 정보를 우선적으로 추출해 냄
○ 【영향】 특정 키워드를 반복적으로 삽입하는 방식은 AI 환경에서 실효성이 낮으며, 콘텐츠 전체의 유기적인 의미 구조와 풍부한 맥락 제공의 중요성이 높아짐
음식으로 설명한 임베딩의 개념
자료: 연구자 작성
이미지의 벡터 임베딩
자료: IBM
○ 【개념】 AI는 크롤링(Crawling)³ 을 통해 수집한 자료를 바탕으로 훈련되는 특성상 최종 업데이트 시점의 정보만을 보유하는 구조적 한계를 지님. 이러한 한계를 극복하기 위해 검색증강생성 기술을 활용하여 답변을 생성하기 전 외부 데이터베이스 실시간 검색을 통해 관련 정보를 수집
○ 【영향】 RAG 구조에서는 어떤 문서가 검색되고 선택되느냐에 따라 AI 답변의 질과 노출되는 브랜드가 결정되면서, 답변 엔진 최적화(AEO, Answer Engine Optimization)·생성형 엔진 최적화(GEO, Generative Engine Optimization)가 마케팅의 핵심 과제로 부상
RAG 기술의 작동 원리
주: 단어, 문장, 문서 등 자연어 데이터의 의미와 맥락을 반영하여 컴퓨터가 연산할 수 있는 다차원의 고정된 숫자 배열로 압축·전 환하는 기술 자료: 긱스포긱스(Geeks for Geeks)
○ 【개념】 RAG를 통한 정보 검색 시 AI가 특정 문서의 내용은 정확히 파악하는 반면, 다른 문서는 제대로 이해하지 못하는 경우가 발생. 이 같은 차이의 근본 원인은 구조화 데이터의 유무에 있음
○ 【영향】 검색 엔진 최적화 기업 브라이트엣지(BrighEdge)의 2026년 조사 결과, 구조화 데이터를 구현한 웹사이트에서 AI 검색 인용 빈도가 44% 증가한 것으로 나타나, 콘텐츠의 구조와 형태가 AI의 선택과 인용에 큰 영향을 미치는 것으로 확인됨
○ ‘벡터 임베딩’이 의미를 수치로 변환하고(무엇이 유사한가), ‘RAG’가 우선적으로 활용할 정보를 검색하며(어떤 정보를 먼저 꺼낼까), ‘구조화 데이터’는 정보를 읽기 쉬운 형태로 정리(어떻게 읽을까). AI의 선택을 받기 위해서는 세 가지 기술적 층위에 모두 최적화되어야 함
“어떤 건물(HTML)이 있고, 공통 표준 서식(JSON)인 등기사항전부증명서에 그 속성을 정의한 내용(스키마)이 기록되어 있어서 누구나 즉시 읽고 파악할 수 있는 구조”
※ 본 보고서는 연구자의 개인 의견으로 KB경영연구소 공식 의견과 다를 수 있으며, 인용시 출처를 밝혀주시기 바랍니다.제약 요인으로 작용할 수 있음
금융용어사전
금융용어사전