open:lsa

잠재 의미 분석(Latent Semantic Analysis, LSA)

잠재 의미 분석(Latent Semantic Indexing, LSI)이라고 부르기도 합니다.

이 방법을 이해하기 위해서는 선형대수학의 특이값 분해(Singular Value Decomposition, SVD)를 이해할 필요가 있습니다.

기존의 DTM이나 DTM에 단어의 중요도에 따른 가중치를 주었던 TF-IDF 행렬은 단어의 의미를 전혀 고려하지 못한다는 단점을 갖고 있었습니다. LSA는 기본적으로 DTM이나 TF-IDF 행렬에 절단된 SVD (truncated SVD)를 사용하여 차원을 축소시키고, 단어들의 잠재적인 의미를 끌어낸다는 아이디어를 갖고 있습니다.


  • open/lsa.txt
  • 마지막으로 수정됨: 2020/07/10 03:07
  • 저자 127.0.0.1