한국경제신문을 뜻하는 한경이라는 글자가 씌인 로고와 한국경제라는 글자가 함께 기재되어 있습니다. 한국경제

대규모 멀티모달모델

large multimodal models

텍스트와 이미지를 통합적으로 이해하고 처리할 수 있는 대규모 언어 모델.



LMM은 텍스트와 이미지를 모두 학습하여 텍스트와 이미지 사이의 경계를 지우고, 텍스트와 이미지를 통합적으로 이해하고 처리할 수 있다.



이는 기존의 LLM보다 더 복잡한 이미지 분석과 추론 능력을 갖추게 하여 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있다.