**모든 자료의 저작권은 아이티윌 이광호 강사님K means 개요[1] 비지도 학습- 종속변수 없이 컴퓨터가 데이터의 패턴/규칙을 찾아내는 방법- 분석가의 주관 개입이 많음- 학습이 끝난 후 평가가 어려움 [2] KMeans 클러스터링- 각 군집의 평균을 활용하여 k 개의 클러스터로 묶는 알고리즘- 데이터 전처리 단계에서 라벨링을 위해 사용하기도 함 [3] 기본 아이디어- 같은 군집 내부 데이터는 서로 가깝게 위치- 서로 다른 군집 간 데이터는 멀리 위치- 거리 기준으로 보통 유클리드 거리 사용 [4] KMeans 의 수행 절차 1) 초기 클러스터링의 수 k 를 정의 2) k 개의 클러스터의 가상의 중심점들을 선택 3) 각 측정값을 가장 가까운 중심점의 클러스터에 할당 4) 새로운 클러스터의 중심 ..