# fasttext ### FastText - Facebook research에서 공개한 open source library - C++ 11 ### Training - 기존의 [[word2vec]]과 유사하나, 단어를 [[n-gram]]으로 나누어 학습을 수행 ### Testing - 입력 단어가 vocabulary에 있을 경우, word2vec과 마찬가지로 해당 단어의 word vector를 return 함 - 만약 [[OOV]]일 경우, 입력 단어의 n-gram vector들의 합산을 return 함 ## train_supervised ``` __label__name h1, title wrap, span, tit, 나이키 스우시 더블와이드 리스트밴드 __label__model div, pop detail content, span, style code, 스타일 : AC2287-924 __label__price div, uk float right, span, price, 13,000 원 __label__nan div, pop detail content, span, style color, 현재 컬러 : 멀티 컬러/블랙 ``` ``` import fasttext model = fasttext.train_supervised( input="./tag_text_list.txt", label="__label__", dim=300, minCount=1 ) model.labels ``` ## Ref - [글쓰기 화면에서 카테고리 자동 추천하는 모델 만들기](https://medium.com/daangn/%EA%B8%80%EC%93%B0%EA%B8%B0-%EC%B9%B4%ED%85%8C%EA%B3%A0%EB%A6%AC-%EC%B6%94%EC%B2%9C%EB%AA%A8%EB%8D%B8-%EA%B0%9C%EB%B0%9C%ED%95%98%EA%B8%B0-cbbcc43e1f7f) - https://fasttext.cc/