word2vec代码注释

虽然word2vec火了很久了,但自己一直拖延了没去看,借实验室组会讨论的机会花一天时间阅读了和word2vec相关的一点东西,算是先知后觉。

 

邓澍军老师的中文教程很不错,顺着里面的文献一路看下去就能了解个差不多,北邮的这位同学总结的也很好。

发现网上没有代码的详细注释,就把自己写的注释,看能不能赚个点击量。

下面是图片版,还有网页版代码版


有两个地方需要注意一下

1. 邓的文章中有如下图的公式,n(w, j)中的 j 是从1(代表根节点)开始算的。如果 code 中的 j 如果也是从 1开始算的话,那公式就错了,应该是 code[j+1],如果是从 0 开始算的话,那就对了。源代码中 code存储霍夫曼编码,point 存储编码在霍夫曼树上的路径,按说应该是一样长的,但其实 point 比 code长1,二者是错位的

word2vec代码注释


2. 下图注释掉的代码是作者的,我起初不理解为什么超出expTable范围的不能用0、1表示(e^6 / (e^6 + 1) =0.9975274),而直接continue。如果 f <= -MAX_EXP 而且 code值为 1 还好,如果code值为0 不就意味着很大的误差没有通过BP传回来么?

发邮件询问 Mikolov,他说是处于计算精度考虑,为了避免太小的 (1 - code[j] - f) (如 1 - 0 -0.9975274 = 0.0024726,MAX_EXP增大,这个值会更小)导致网络参数出现-infs和NANs,不过他也不知道这种负面影响具体有多大。

不过我寻思着总不能放着totallywrong的编码不管吧,我擅自把代码改成下面的样子,训练结果确实有一些变化,但在具体应用上是好是坏,还是不造。

word2vec代码注释


代码注释如下,就检查了一遍,有错误欢迎指出。

word2vec代码注释


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值