A Neural Probabilistic Language Model笔记

最新推荐文章于 2022-03-02 14:31:56 发布

t半城烟沙

最新推荐文章于 2022-03-02 14:31:56 发布

阅读量905

点赞数

1.经典之paper，虽然之前一直有了解，但是未及细读，现在终于有时间好好研究一下了。
2.首先是一个概率模型：
这里写图片描述
3.然后是两个假设条件：First, it is not taking into account contexts farther than 1 or 2 words,1 second it is not taking into account the “similarity” between words.
所以模型：
4.具体模型

4.1输入层（第一层）：一个C映射， $w_i$ 的维度是1xV，C的维度是Vxm，所以1xVxVxm=1xm；第二层tanh函数进行计算，在最后的实验中，Bengio 发现直连边虽然不能提升模型效果，但是可以少一半的迭代次数。同时他也猜想如果没有直连边，可能可以生成更好的词向量；输出层：softmax函数。
4.2目标函数
每一层的参数，和维度
最终训练的C就是我们需要的词向量
5.伪代码
这里写图片描述

6.训练的时候要找一个好点的语料库，因为自己的文本词频一般都不够。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。