본문 바로가기

AI 및 관련 기술 확산(1960년대~1990년대)

데이터 분석의 시작! 클러스터링 용어와 활용 예시 쉽게 배우기

by AI 댕댕이 2025. 6. 7.

클러스터링은 여러 데이터(정보)들을 비슷한 것끼리 뭉치게(모으게) 만드는 방법이에요.
예를 들어, 동물 친구들을 키, 몸무게, 털 색깔 등으로 나누어서 비슷하게 생긴 동물끼리 그룹을 만드는 것과 같아요.

비슷한 친구들끼리 뭉치는 클러스터링

왜 클러스터링이 필요할까요? 🧐

우리가 아주 많은 정보를 한 번에 다루다 보면, 그 안에서 비슷한 특징을 가진 데이터끼리 모으면 더 쉽게 이해할 수 있어요.
예를 들어,

강아지 산책 기록 데이터를 **“산책이 짧은 날”과 “산책이 긴 날”**로 나눌 수 있어요.
쇼핑몰에서는 손님들을 **“비슷한 취향”**에 따라 모아 맞춤 상품을 추천해 줄 수 있어요.

데이터를 똑똑하게 분류하는 클러스터링!

클러스터링에서 자주 쓰는 용어 📝

용어뜻(설명)이모지

클러스터(Cluster)	비슷한 데이터끼리 모인 집단(그룹)	🧩
센트로이드(Centroid)	클러스터의 가운데(중심)에 있는 점	🎯
거리(Distance)	데이터들 사이의 차이 정도(얼마나 떨어져 있는지)	📏
K-평균(K-means)	자주 쓰는 클러스터링 방법, 데이터를 K개의 그룹으로 나눔	🔢
계층적 클러스터링(Hierarchical Clustering)	계단처럼 단계별로 데이터를 묶어 나가는 방법	🌳

데이터 그룹이 색깔별로 나뉘는 모습

클러스터링은 어디에 쓰일까요? 💡

클러스터링은 우리가 생활 속에서도 자주 만나는 기술이에요!

사진 정리: 비슷한 얼굴끼리 폴더로 모으기
음악 추천: 비슷한 음악을 좋아하는 사람들끼리 묶어서 맞춤 추천
반려동물 건강 분석: 강아지의 활동 패턴을 비슷한 날끼리 모아 건강 상태 확인

똑똑한 분석으로 건강 지키기

K-평균 클러스터링은 어떻게 동작할까?

K-평균(K-means) 클러스터링은 대표적인 클러스터링 방법이에요.

나누고 싶은 그룹(K) 수를 정해요.
무작위로 그룹의 중심(센트로이드)을 정해요.
각 데이터를 가장 가까운 중심에 모아 그룹을 만들어요.
그룹의 중심을 다시 계산해요.
이 과정을 그룹이 안정될 때까지 반복해요!

단계별로 그룹이 만들어지는 과정

연도별 주요 클러스터링 알고리즘

(같은 년도가 아니면 표로!)

알고리즘 이름발표 연도

K-평균(K-means)	1957년
DBSCAN	1996년
Mean Shift	1975년
계층적 클러스터링	1960년대
Spectral Clustering	2001년

시대별로 발전한 클러스터링 기술

요약 정리 🌟

클러스터링은 비슷한 데이터끼리 그룹으로 묶는 기술이에요.
데이터 분석, 인공지능, 쇼핑몰 추천, 사진 분류 등 다양한 곳에서 쓰여요.
대표적인 용어로는 클러스터, 센트로이드, 거리, K-평균, 계층적 클러스터링 등이 있어요.
오래된 K-평균부터 최신 알고리즘까지 많은 방법이 발전해 왔어요.

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

'AI 및 관련 기술 확산(1960년대~1990년대)' 카테고리의 다른 글

기계학습 편향이란? 초등학생도 이해하는 쉬운 설명 🤖✨ (2)	2025.06.09
데이터셋이란? 초등학생도 이해하는 쉬운 설명과 예시!🧸 (1)	2025.06.08
증강 현실(AR) 기반 기술이란? 🤔 (2)	2025.06.06
가상 현실 (VR) (4)	2025.06.05
의사 결정 나무 AI란? 🌳 (8)	2025.06.04

티스토리툴바