读论文《Efficient Estimation of Word Representations in Vector Space》

最新推荐文章于 2023-03-06 15:51:39 发布

VIP文章 Doit_行之

最新推荐文章于 2023-03-06 15:51:39 发布

阅读量2.3k

点赞数 1

分类专栏：论文深度学习文章标签：神经网络自然语言处理 word2vec

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31456593/article/details/77513173

版权

读论文《Efficient Estimation of Word Representations in Vector Space》

原文地址：http://blog.csdn.net/qq_31456593/article/details/77513173

introduce

词的分布式表示（又称词嵌入，word embedding）因为这篇文章开始大火，原来的word embedding只是神经网络语言模型的副产物，而该论文的主要的目标是训练具有语义特征的word embedding。

本文体提出了2个模型，一个是Continuous Bag-of-WordS Model(CBOW),一个是Continuous Skip-gram Model（Skip-gram）
其中CBOW是用上下文的词预测中间词，Skip-gram是用中间词预测上下文的词。

考虑到原来的神经语言模型算法复杂度高，训练时间长，本文的两个网络都去掉了非线性隐藏层，并在输出层使用哈夫曼树结构进行hierarchical softmax，使复杂度大大降低，一天的时间就可以训练16亿单词量的语料。且最终生成的词嵌入满足类似king-man+women=queen的语义关系。

method

论文的2个模型如下文所示

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
读论文《Efficient Estimation of Word Representations in Vector Space》

词的分布式表示（又称词嵌入，word embedding）因为这篇文章开始大火，原来的word embedding只是神经网络语言模型的副产物，而该论文的主要的目标是训练具有语义特征的word embedding。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。