最近实习的导师交给我一个跟深度学习有关的项目,于是研究了一下其中的一个分支文本分类,自然免不了要认真研读一下google开源的word2vec项目,本来想写一篇博文详细解析一下其中的算法和具体的代码,不过感觉网上的很多文章写得非常好,我也是参考了它们才勉强对这个项目有了一点理解,就不班门弄斧了,先将一些我觉得不错的博文贴在下面,以供查看:
1、 word2vec 中的数学原理详解
最初看到了一个系列博文写的很好,相信很多人都看过,我也是因为这篇文章才对word2vec算是入了点门,主要讲解word2vec中涉及到的两个主要的算法,比较好的一点是补充了很多准备知识,非常方便理解
2、Word2Vec源码解析
这篇文章是在浏览上述第一组文章的时候,看到下面有评论指出了部分错误,感觉说得有些道理,而且对代码解释的也比较多
3、word2vec源码解析之word2vec.c
最后这篇对代码进行了注释,也值得一看。不过其实之前还看到过一篇注解更为详细的,只是一时找不到了,日后找到的话再贴上来