0x00 背景
最近在做毕设,需要使用Google的word2vec。查阅了相关资料,总结后,写下这篇。
注,本文大多取自以下内容:
cbow例子,取自知乎,已取得答主同意
word2vec数学原理详解
word2vec今生前世
0X01 简介
word2vec是Google与2013年开源推出的一个用于获取word vecter的工具包,利用神经网络为单词寻找一个连续向量看空间中的表示。
word2vec有两种网络模型,分别为:
- Continous Bag of Words Model (CBOW)
- Skip-Gram Model
在开始之前,需要一些准备知识(统计语言模型):
- 《word2vec的前世今生》
http://www.cnblogs.com/iloveai/p/word2vec.html
- 吴军博士的《数学之美》