5.2 Word2Vec词向量
5.2.1 Word2Vec的基本原理
词嵌入(Word Embedding):
Word2Vec包含两种深度学习的模型:
1.CBOW(Continuous Bag-of-Words):
2.Skip-Gram
5.2.2 Word2Vec模型细节及代码演示
Word2Vec的三大创新:
1.将常见的单词组合(或者说词组)当做一个单词来处理:
2.对高频词进行抽样处理:
3.负采样:
5.2.3 应用工具训练Word2Vec
gensim中的Word2Vec库,封装了谷歌的Word2Vec模型。