open:fasttext

fasttext

  • Facebook research에서 공개한 open source library
  • C++ 11
  • 기존의 word2vec과 유사하나, 단어를 n-gram으로 나누어 학습을 수행
  • 입력 단어가 vocabulary에 있을 경우, word2vec과 마찬가지로 해당 단어의 word vector를 return 함
  • 만약 OOV일 경우, 입력 단어의 n-gram vector들의 합산을 return 함
__label__name h1, title wrap, span, tit, 나이키 스우시 더블와이드 리스트밴드
__label__model div, pop detail content, span, style code, 스타일 : AC2287-924
__label__price div, uk float right, span, price, 13,000 원
__label__nan div, pop detail content, span, style color, 현재 컬러 : 멀티 컬러/블랙
import fasttext

model = fasttext.train_supervised(
    input="./tag_text_list.txt", label="__label__", dim=300, minCount=1
)
model.labels
  • open/fasttext.txt
  • 마지막으로 수정됨: 2020/10/29 07:39
  • 저자 127.0.0.1