word2vec原理简述

最新推荐文章于 2024-05-30 15:58:15 发布

san.hang

最新推荐文章于 2024-05-30 15:58:15 发布

阅读量400

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/randomstring/p/10439384.html

版权

（原创）

word2vec是将单词转为向量，并为后续应用机器学习的算法做准备。

经典的模型有两种，skip-gram和cbow，

其中，skip-gram是给定输入单词来预测上下文，而cbow相反，是给定上下文来预测输入单词。下面主要介绍skip-gram：

1.skip-gram训练词对

skip-gram首先设定所谓一个值（ skip_window），作为一个单词选取它的上下文的单词的数量，

这些词对，作为训练数据，如 “the quick brown fox jumps over lazy dog”，对于quick，有

（quick，the），（quick，brown），（quick，fox）三个词对，作为quick的训练标签。

2.word嵌入到k维空间，k维向量化

接下来是对语料中单词的向量化处理，首先将语料中不重复的单词都拿出来成为词汇表，

然后对其进行one-hot编码，如10000个单词，其中a编码为 [1,0,0,0....]，这个时候单词已经转为了向量，但是只是这样并不能看出任意两词之间的相关性，而且词汇表如果大的话，导致维度灾难。

Hinton提出了映射到K维向量的思想，基于这个思想用一个简单的多分类的神经网络来训练得到这些K为向量。

输入层是n个one-hot编码的词，输出也是one-hot编码的词（对skipgram的词对进行训练），

隐含层为 k个神经元节点，含有n*k的权重矩阵，经过这层将词向量转换为k维向量，

再经softmax输出为n维的预测概率向量，优化残差函数，训练权重系数。

最终训练结束后，这个n*k的权重矩阵的每一行就作为该单词的k维向量了。

转载于:https://www.cnblogs.com/randomstring/p/10439384.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
word2vec原理简述

（原创）word2vec是将单词转为向量，并为后续应用机器学习的算法做准备。经典的模型有两种，skip-gram和cbow，其中，skip-gram是给定输入单词来预测上下文，而cbow相反，是给定上下文来预测输入单词。下面主要介绍skip-gram：1.skip-gram训练词对skip-gram首先设定所谓一个值（ skip_window），作为一个单词选取它的上下文的单词...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。