word2vec词向量原理及公式

最新推荐文章于 2024-03-22 20:31:50 发布

xuhuixuexiqt

最新推荐文章于 2024-03-22 20:31:50 发布

阅读量1k

点赞数

分类专栏：机器学习算法文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuhuixuexiqt/article/details/104942139

版权

word2vec利用词的上下文关系学习词向量，包括CBOW和skip-gram模型。CBOW用上下文预测中心词，skip-gram则用中心词预测上下文。优化方法涉及Hierarchical Softmax和Negative Sampling，降低计算复杂度。

摘要由CSDN通过智能技术生成

word2vec原理

概念
一句话中，连续的词之前是有内在联系的，那么可以借助这种关系来学习出每个词的向量表示。这样做的好处是，可以更充分利用先验知识，提升下游任务的效果。
例子
content=我/是/自然语言/工程师，‘自然语言’与‘我’、‘的’、‘工程师’三个词强相关，所以可以通过我/是/x/工程师来预测x位置的词

网络结构

简单模型
– 使用一个词预测一个词的概率，我/是/自然语言/工程师，通过‘我’预测‘我’的概率，看起来有点奇怪，但这正是这神奇的地方；
– 具体网络结构如下：
这里需要注意几个参数：x表示输入词（初始化的时候用one-hot编码），V表示整个训练语料中词的大小，h表示隐层神经元，N表示神经元个数，y表示输出词；
衍生几个问题：
1.最终输出的词向量在哪？
$W_{V*N}和W_{V*N}^/都可以作为词向量，一般情况下选择W_{V*N}作为词向量$
2.怎样构造目标函数和损失函数，并且怎样去优化它？

构造目标函数

目标函数

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。