딥 러닝을 이용한 자연어 처리 입문
2. 텍스트 전처리
4. 카운트 기반의 단어 표현
1) 다양한 단어의 표현 방법
- Word Representation
- Local Representation (국소 표현)
- One-hot Vector
- N-gram
- Count Based
- Continuous Representation (연속 표현)
- Prediction Based
- Count Based
- Full Document
- Windows
4) TF-IDF (Term Frequency-Inverse Document Frequency)
5. 문서 유사도
2) 여러가지 유사도 기법
6. 토픽 모델링(Topic Modeling)
토픽(Topic)은 한국어로 주제라고 합니다. 토픽 모델링이란 기계 학습 및 자연어 처리 분야에서 토픽이라는 문서 집합의 추상적인 주제를 발견하기 위한 통계적 모델 중 하나로, 텍스트 본문의 숨겨진 의미 구조를 발견하기 위해 사용되는 텍스트 마이닝 기법입니다.
1) 잠재 의미 분석(Latent Semantic Analysis, LSA)
8. 딥 러닝(Deep Learning)의 개요
- 옵티마이저 (Optimizer)
- 역전파 (BackPropagation)
- 과적합 (Overfitting)
- 케라스 (Keras)
과적합 Overfitting을 막는 방법