자연어처리(NLP) - 컴퓨터가 자연어를 이해하는 방법(벡터화)
자연어처리(NLP) - 컴퓨터가 자연어를 이해하는방법(벡터화) 사람은 문장에서 단어가 어떤 의미로 사용되었는지 문맥을 통해 바로 구분할 수 있지만 기계는 그렇게 할 수 없다. 그렇기 때문에 단어를 수치로 표현해서 기계가 이해할 수 있도록 해야 한다. 텍스트를 숫자로 표현하는 방법이고 벡터화한다고 한다. 주요 키워드 : NLP, vector, One-hot encoding, Word-Embedding, BOW, Counter Vector, TF-IDF, Word2Vec, CBOW, Skip-gram, Sparse, Dense 벡터화 표현 방법 - 희소표현(Sparse Representation)과 밀집표현(Dense Representation) 1. 희소표현(Sparse Representation) Spa..