전체 글 59

[아이티윌 빅데이터 52기] 비지도 학습 | 군집분석 | K MEANS 개요 | Iris 붓꽃 분류

비지도 학습 > 군집분석 > KMEANS > Iris 붓꽃 데이터 세트 활용 STEP 1. 데이터 세트 확인 STEP 2 . 데이터 전처리- 군집 분석은 종속 변수가 존재하지 않으므로, 종속변수를 제외하여 데이터 추출 - 만약 군집분석 후 나눠진 군집을 기존의 종속변수와 비교하려는 시도는 로지스틱 회귀 분석으로 통계량이 제공되는 과정이 더 나을수 있음 df= origin.drop('Species' , axis=1)df.head() STEP 3.K Means 의 하이퍼 파라미터 (1) Inertia : K MEANS 의 성능 평가 지표- 각 데이터가 자신의 군집 중심까지 떨어진 거리의 제곱합 - 즉, 이 이너셔 값이 작을수록 각 데이터 포인트의 군집의 중심점을 기준으로 잘 뭉쳐있음을 의미 - ..

카테고리 없음 2026.01.20

[아이티윌 빅데이터 52기] 비지도 학습 | 군집분석 | K MEANS 개요

**모든 자료의 저작권은 아이티윌 이광호 강사님K means 개요[1] 비지도 학습- 종속변수 없이 컴퓨터가 데이터의 패턴/규칙을 찾아내는 방법- 분석가의 주관 개입이 많음- 학습이 끝난 후 평가가 어려움 [2] KMeans 클러스터링- 각 군집의 평균을 활용하여 k 개의 클러스터로 묶는 알고리즘- 데이터 전처리 단계에서 라벨링을 위해 사용하기도 함 [3] 기본 아이디어- 같은 군집 내부 데이터는 서로 가깝게 위치- 서로 다른 군집 간 데이터는 멀리 위치- 거리 기준으로 보통 유클리드 거리 사용 [4] KMeans 의 수행 절차 1) 초기 클러스터링의 수 k 를 정의 2) k 개의 클러스터의 가상의 중심점들을 선택 3) 각 측정값을 가장 가까운 중심점의 클러스터에 할당 4) 새로운 클러스터의 중심 ..

Machine Learning 2026.01.20

[아이티윌 빅데이터 52기] Data Analysis Basic | Lab 01 | NumPy Library

[아이티윌 빅데이터 52기] Data Analysis Basic | Lab 01 | NumPy Library*모든 자료의 저작권은 아이티윌 이광호 강사님 - NumPy 시작하기-ndarray 의 주요 기능-그 밖의 ndarray 형태-ndarray 형태 변환 1. NumPy 시작하기NumPy 는 파이썬으로 할 수있는 수치 계산도구C 를 파이썬으로 감싸고 있기 때문에 속도 처리가 빠름 가장 중요한 점은 리스트의 단점을 보완하고 있다는 점 (효율성) NumPy 의 핵심 자료 구조는 ndarrayndarray 는 리스트 처럼 생긴 배열, 일반 리스트와의 차이는 규칙적인 데이터들의 묶음리스트는 데이터 타입에 제약이 없지만 배열은 같은 타입만 넣을 수 있음n 차원의 객체로 평균 행렬 연산 등을 한번에 수행할 ..