word2vec原理

最新推荐文章于 2021-04-28 18:30:50 发布

dou957

最新推荐文章于 2021-04-28 18:30:50 发布

阅读量310

点赞数

文章标签：深度学习机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dou957/article/details/106343595

版权

参考Xin Rong的论文 word2vec Parameter Learning Explained，写得真的很好

输入的onehot是只有一个元素为1其他全为0的，因此，我们做一个矩阵乘法，相当于把矩阵W中的某一行全部取出而已！！！

cbow版本是输入context，输出中心词

skip gram版本是输入中心词，输出context

其中，skipgram在大型语料库中的表现较好。

层次Softmax 实际上是把一个超大的多分类问题转化成一系列二分类问题

对于w2v，在output的时候，计算出每个词的一个score，之后有一个softmax运算，softmax运算的大部分时间在于分母的计算，而如果使用了层次softmax，从一个词到另一个词的过程相当于一个构造一棵haffman树往并下走（补充：haffman数是二叉树，其中权重越大的越靠近根节点，所有节点的权重之和比其他方式都小）

每往下一层，就相当于一个二分类（逻辑斯蒂回归，二元softmax），而从一个根节点到叶子节点的总共的概率就是各层概率之和，

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。