목차

NLP

자연어 처리 ⇒ 자연어를 컴퓨터가 해독하고 그 의미를 이해하는 기술

다양한 자연어 처리 기술

자연어 처리의 단계

다양한 자연어 처리 Applications

파이썬 기반 NLP, 텍스트 분석 패키지

NLTK(National Language Toolkit for Python)
파이썬의 가장 대표적인 NLP 패키지
NLP의 거의 모든 영역 커버
많은 NLP 패키지가 NLTK의 영향을 받아 작성
수행 속도 측면에서 아쉬운 부분이 있어 대량 데이터셋에서 제대로 활용되지 못함

Gensim
토픽 모델링 분야에서 가장 두각을 나타내는 패키지

SpaCy
뛰어난 수행 성능으로 최근 주목받는 패키지

NLP 실험

출처


관련 문서