词向量－－自然语言的数学描述

最新推荐文章于 2020-10-22 21:45:33 发布

han____shuai

最新推荐文章于 2020-10-22 21:45:33 发布

阅读量1.2k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/han____shuai/article/details/52797096

版权

自然语言处理（NLP）中词向量质量依赖三个点：训练语料、训练算法、词向量长度。

用神经网络训练语料模型的思想最早由百度的徐伟提出。

Bengio 于2003年发表JMLR上　 A Neural Probabilistic Language Model .　其后有一系列研究，包括谷歌 Tomas Mikolov 团队的 word2vec。

自然语言处理领域的特征提取包括如下两种统计学习方法：

统计词共同出现的次数（LDA,一种贝叶斯概率模型）。
根据相似的上下文（word2vec, 即 NN ）。

向量是数学空间中的单词，向量的每一维是数学空间中的字母，向量的描述构成了矩阵空间中的语言。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。