# 파이썬 머신러닝 완벽 가이드 {{tag>python machine learning ml guide}} 권철민 지음 예제 코드 : https://github.com/wikibook/ml-definitive-guide ## 1 파이썬 기반의 머신러닝과 생태계 이해 - [[머신러닝]]의 개념 - 파이썬 머신러닝 생태계를 구성하는 주요 패키지 - [[numpy|넘파이]] - 데이터 핸들링 - [[pandas|판다스]] ## 2 사이킷런으로 시작하는 머신러닝 - [[사이킷런]] 소개와 특징 - 첫 번째 머신러닝 만들어 보기 - [[붓꽃 품종 예측]]하기 - 사이킷런의 기나 프레임워크 익히기 - Model Selection 모듈 소개 - [[데이터 전처리]] - 사이킷런으로 수행하는 [[타이타닉 생존자 예측]] ## 3 평가 - [[정확도]] Accuracy - [[오차 행렬]] - [[정밀도]]와 [[재현율]] - [[F1 스코어]] - [[ROC]] 곡선과 [[AUC]] - [[피마 인디언 당뇨병 예측]] ## 4 분류 - [[분류]]의 개요 - [[결정 트리]] - [[앙상블]] 학습 - [[랜덤 포레스트]] - [[GBM]] Gradient Boosting Machine - [[XGBoost]] eXtra Gradient Boost - [[LightGBM]] - 분류 실습 - [[캐글 산탄데르 고객 만족 예측]] - 분류 실습 - [[캐글 신용카드 사기 검출]] - [[스태킹 앙상블]] ## 5 회귀 - [[회귀]] 소개 - [[단순 선형 회귀]]를 통한 회귀 이해 - 비용 최소화히기 - [[경사 하강법]] 소개 - 사아킷런 LinearRegression을 이용한 [[보스턴 주택 가격 예측]] - [[다항 회귀]]와 과(대)적합/과소적합 이해 - 규제 선형 모델 - [[릿지]], [[라쏘]], [[엘라스틱넷]] - [[로지스틱 회귀]] - [[회귀 트리]] - 회귀 실습 - [[자전거 대여 수요 예측]] - 회귀 실습 - [[캐글 주택 가격 - 고급 회귀 기법]] ## 6 차원 축소 - [[차원 축소]] (Dimension Reductino) 개요 - [[PCA]] Principal Component Analysis - [[LDA]] Linear Discriminant Analysis - [[SVD]] Singular Value Decomposition - [[NMF]] Non-Negative Matrix Factorization ## 7 군집화 - [[K-평균]] 알고리즘 이해 - [[군집 평가]] - [[평균 이동]] - [[GMM]] Gaussian Mixture Model - [[DBSCAN]] - [[군집화]] 실습 - [[고객 세그먼테이션]] ## 8 텍스트 분석 - [[텍스트 분석]] 이해 - 텍스트 사전 준비 작업 - [[텍스트 정규화]] - Bag of Words - [[BOW]] - 텍스트 분류 실습 - [[20 뉴스그룹 분류]] - [[감성 분석]] - [[토픽 모델링]] - [[20 뉴스그룹]] - [[문서 군집화]] 소개와 실습 - [[문서 유사도]] - 한글 텍스트 처리 - [[네이버 영화 평점 감성 분석]] - 텍스트 분석 실습 - 캐글 [[Mercari Price Suggesion Challenge]] ## 9 추천 시스템 - [[추천 시스템]]의 개요와 배경 - [[콘텐츠 기반 필터링]] 추천 시스템 - [[최근접 이웃 협업 필터링]] - [[잠재 요인 협업 필터링]] - [[콘텐츠 기반 필터링]] 실습 - [[TMDB 5000 영화 데이터 세트]] - 아이템 기반 최근접 이웃 협업 필터링 실습 - 행렬 분해를 이용한 [[잠재 요인 협업 필터링]] 실습 - 파이썬 추천 시스템 패키지 - [[Surprise]]