군집화(클러스트링: Clustering)는 데이터의 유사성을 기준으로 여러 데이터를 그룹(군집)으로 묶는 머신러닝 기법이다.
데이터를 미리 정해진 범주로 분류하는 분류(Classification)와 달리, 군집화는 라벨이 없는 데이터를 분석해 유사한 것끼리 자동으로 묶는 방식이다.
특정 키워드를 검색했을 때 관련된 뉴스를 자동으로 그룹화해 제공하는 서비스도 군집화 방식의 대표적 활용 사례다.
유사한 기사들을 묶어 정보를 더 구조적이고 효율적으로 제공할 수 있다.