비지도 학습 > 군집분석 > KMEANS > Iris 붓꽃 데이터 세트 활용 STEP 1. 데이터 세트 확인 STEP 2 . 데이터 전처리- 군집 분석은 종속 변수가 존재하지 않으므로, 종속변수를 제외하여 데이터 추출 - 만약 군집분석 후 나눠진 군집을 기존의 종속변수와 비교하려는 시도는 로지스틱 회귀 분석으로 통계량이 제공되는 과정이 더 나을수 있음 df= origin.drop('Species' , axis=1)df.head() STEP 3.K Means 의 하이퍼 파라미터 (1) Inertia : K MEANS 의 성능 평가 지표- 각 데이터가 자신의 군집 중심까지 떨어진 거리의 제곱합 - 즉, 이 이너셔 값이 작을수록 각 데이터 포인트의 군집의 중심점을 기준으로 잘 뭉쳐있음을 의미 - ..