word2vec代码注释

最新推荐文章于 2024-04-19 21:51:12 发布

数据娃掘

最新推荐文章于 2024-04-19 21:51:12 发布

阅读量809

点赞数

分类专栏： NLP/DeepLearning 文章标签： word2vec

NLP/DeepLearning 专栏收录该内容

319 篇文章 12 订阅

订阅专栏

虽然word2vec火了很久了，但自己一直拖延了没去看，借实验室组会讨论的机会花一天时间阅读了和word2vec相关的一点东西，算是先知后觉。

邓澍军老师的中文教程很不错，顺着里面的文献一路看下去就能了解个差不多，北邮的这位同学总结的也很好。

发现网上没有代码的详细注释，就把自己写的注释，看能不能赚个点击量。

下面是图片版，还有网页版，代码版。

有两个地方需要注意一下：

1. 邓的文章中有如下图的公式，n(w, j)中的 j 是从1（代表根节点）开始算的。如果 code 中的 j 如果也是从 1开始算的话，那公式就错了，应该是 code[j+1]，如果是从 0 开始算的话，那就对了。源代码中 code存储霍夫曼编码，point 存储编码在霍夫曼树上的路径，按说应该是一样长的，但其实 point 比 code长1，二者是错位的。

2. 下图注释掉的代码是作者的，我起初不理解为什么超出expTable范围的不能用0、1表示（e^6 / (e^6 + 1) =0.9975274），而直接continue。如果 f <= -MAX_EXP 而且 code值为 1 还好，如果code值为0 不就意味着很大的误差没有通过BP传回来么？

发邮件询问 Mikolov，他说是处于计算精度考虑，为了避免太小的 (1 - code[j] - f) （如 1 - 0 -0.9975274 = 0.0024726，MAX_EXP增大，这个值会更小）导致网络参数出现-infs和NANs，不过他也不知道这种负面影响具体有多大。

不过我寻思着总不能放着totallywrong的编码不管吧，我擅自把代码改成下面的样子，训练结果确实有一些变化，但在具体应用上是好是坏，还是不造。

代码注释如下，就检查了一遍，有错误欢迎指出。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
word2vec代码注释

虽然word2vec火了很久了，但自己一直拖延了没去看，借实验室组会讨论的机会花一天时间阅读了和word2vec相关的一点东西，算是先知后觉。邓澍军老师的中文教程很不错，顺着里面的文献一路看下去就能了解个差不多，北邮的这位同学总结的也很好。发现网上没有代码的详细注释，就把自己写的注释，看能不能赚个点击量。下面是图片版，还有网页版，代码版。有两个
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。