李沐第十六课《词向量word2vec》

最新推荐文章于 2023-06-28 13:55:44 发布

苏何月下追韩信丶

最新推荐文章于 2023-06-28 13:55:44 发布

阅读量801

点赞数 1

分类专栏：李沐课程学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010995990/article/details/79404589

版权

本文介绍了word2vec工具及其包含的skip-gram和CBOW模型，详细阐述了这两种模型的工作原理及计算流程。此外，还讨论了word2vec训练过程中的近似方法，如负采样和层序softmax，以解决计算复杂度问题。通过实例帮助理解word2vec如何捕获词之间的相似性和类比关系。

摘要由CSDN通过智能技术生成

首先word2vec只是一个工具，然后word2vec主要包含两个模型:skip-gram(跳字模型)和CBOW模型(continuous bag of words 连续词袋模型)，然后还包括两种高效的训练方法：负采样(negative sampling)和层序softmax(hierarchical softmax)。word2vec可以较好的表达不同词之间的相似和类比关系。

skip-gram模型：
在skip模型中，我们用一个词（叫做中心词）来预测它周围的词。例如给定文本序列”the”,”man”,”hit”,”his”,”son”,那么skip-gram模型所做的就是，给定”hit”来生成它邻近词”the”,”man”,”his”,”son”的概率。那么”hit”叫做中心词，其他的四个词叫做背景词。
具体计算流程如下：

对于上述计算过程，理解即可，偶尔

最低0.47元/天解锁文章

苏何月下追韩信丶

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。