读论文《A Neural Probabilistic Language Model》

最新推荐文章于 2022-03-02 14:31:56 发布

Doit_行之

最新推荐文章于 2022-03-02 14:31:56 发布

阅读量2.2k

点赞数 2

分类专栏：论文深度学习文章标签：自然语言处理深度学习词嵌入

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31456593/article/details/77482256

版权

《A Neural Probabilistic Language Model》论文解读，介绍如何通过神经网络解决词向量的维数灾难问题，学习词的分布式表示，即词嵌入。模型基于n-gram，最大化上文n个词对当前词的预测概率，实现语言模型和词向量的训练。词嵌入可用于衡量词汇间的语义相似性。

摘要由CSDN通过智能技术生成

读论文《A Neural Probabilistic Language Model》

原文地址：http://blog.csdn.net/qq_31456593/article/details/77482256

introduce

本文算是训练语言模型的经典之作，Bengio将神经网络引入语言模型的训练中，并得到了词嵌入这个副产物。词嵌入对后面深度学习在自然语言处理方面有很大的贡献，也是获取词的语义特征的有效方法。

论文的提出源于解决原词向量（one-hot表示）会照成维数灾难的问题，作者建议通过学习词的分布式表示来解决这个问题。作者基于n-gram模型，通过使用语料对神经网络进行训练，最大化上文的n个词语对当前词语的预测。该模型同时学到了（1）每个单词的分布式表示和（2）单词序列的概率分布函数。

该模型学习到的词汇表示，与传统的one-hot表示不同，它可通过词嵌入之间的距离（欧几里得距离、余弦距离等），表示词汇间的相似程度。如在：
The cat is walking in the bedroom
A dog was running in a room
中，cat和dog有着相似的语义

method

作者提出的网络模型如下图所示：

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。