open:pca

PCA (주성분 분석)

abvayge.jpg

PCA로 고차원의 Feature 중 중요한 몇 가지를 추출(extract)

https://blog.naver.com/hancury/221215245092

분산이 크다 = 주어진 정보가 많다

주어진 데이터의 분산을 표현할 수 있는 벡터를 찾을 수 있다면,

그 중 표현력이 큰 벡터를 선별 후 원본 데이터를 투영

k차원의 새로운 데이터 셋으로 재구성 (k < d)

from sklearn.decomposition import PCA
 
pca = PCA(n_components=60, svd_solver='full')
 
dummied = dummied.drop(columns=['id', 'income_<=50K', 'income_>50K'])
 
X_train_std = st_scaler.fit_transform(dummied)
X_train_pca = pca.fit_transform(X_train_std)


  • open/pca.txt
  • 마지막으로 수정됨: 2021/05/12 14:05
  • 저자 127.0.0.1