전체 글 60

UCI Wholesale 데이터로 보는 고객 세분화 & 채널 예측 태블로 대시보드 구현 (K-means, PCA, TabPy, AWS EC2 서버 연동)

0. 분석의 시작점McKinsey & Company는 데이터 기반 의사결정을 내리는 기업이 그렇지 않은 기업보다 고객 유치 확률은 23배, 수익성은 19배 더 높다고 강조합니다. 특히 Bain & Company의 2025 소비자 제품 보고서에 따르면 글로벌 소비재(CPG) 판매 성장률이 둔화되고 있는 지금, 유통 기업들에게 데이터는 위기를 돌파할 가장 현실적인 열쇠가 되었습니다. 이미 글로벌 유통 시장은 데이터를 통해 혁신을 만들어내고 있습니다. Sysco(시스코): 과거 구매 패턴을 AI로 분석해 '재구매 시점'을 선제적으로 제안하며 외식 수요 감소 위기를 돌파했습니다.Amazon(아마존): 주문 전 물품을 이동시키는 '예측 배송'으로 물류 패러다임을 전환했습니다.왜 도매(Wholesale) 분석에서 ..

[아이티윌 빅데이터 52기] 비지도 학습 | 군집분석 | K MEANS 개요 | Iris 붓꽃 분류

비지도 학습 > 군집분석 > KMEANS > Iris 붓꽃 데이터 세트 활용 STEP 1. 데이터 세트 확인 STEP 2 . 데이터 전처리- 군집 분석은 종속 변수가 존재하지 않으므로, 종속변수를 제외하여 데이터 추출 - 만약 군집분석 후 나눠진 군집을 기존의 종속변수와 비교하려는 시도는 로지스틱 회귀 분석으로 통계량이 제공되는 과정이 더 나을수 있음 df= origin.drop('Species' , axis=1)df.head() STEP 3.K Means 의 하이퍼 파라미터 (1) Inertia : K MEANS 의 성능 평가 지표- 각 데이터가 자신의 군집 중심까지 떨어진 거리의 제곱합 - 즉, 이 이너셔 값이 작을수록 각 데이터 포인트의 군집의 중심점을 기준으로 잘 뭉쳐있음을 의미 - ..

카테고리 없음 2026.01.20

[아이티윌 빅데이터 52기] 비지도 학습 | 군집분석 | K MEANS 개요

**모든 자료의 저작권은 아이티윌 이광호 강사님K means 개요[1] 비지도 학습- 종속변수 없이 컴퓨터가 데이터의 패턴/규칙을 찾아내는 방법- 분석가의 주관 개입이 많음- 학습이 끝난 후 평가가 어려움 [2] KMeans 클러스터링- 각 군집의 평균을 활용하여 k 개의 클러스터로 묶는 알고리즘- 데이터 전처리 단계에서 라벨링을 위해 사용하기도 함 [3] 기본 아이디어- 같은 군집 내부 데이터는 서로 가깝게 위치- 서로 다른 군집 간 데이터는 멀리 위치- 거리 기준으로 보통 유클리드 거리 사용 [4] KMeans 의 수행 절차 1) 초기 클러스터링의 수 k 를 정의 2) k 개의 클러스터의 가상의 중심점들을 선택 3) 각 측정값을 가장 가까운 중심점의 클러스터에 할당 4) 새로운 클러스터의 중심 ..

Machine Learning 2026.01.20