手把手带你弄清楚Word2Vec训练过程

最新推荐文章于 2024-03-21 14:28:31 发布

starry0001

最新推荐文章于 2024-03-21 14:28:31 发布

阅读量587

点赞数

分类专栏： NLP 文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39158406/article/details/105167222

版权

NLP 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

由于这个排班玩不来，贴上word文档的链接
https://pan.baidu.com/s/1mMEWk1_v31s_AfJPAwgsYQ 提取码：d6vm
Word2Vec是自然语言处理中最基本的内容，对于初学者来说可能并不怎么好理解。这个内容我断断续续地学了几次，每次都有不少的收获，现在差不多读懂了，因此将其完整地表述出来，供各位入门者学习，希望可以帮助到大家。

训练数据获取

大家可能都听过Word2Vec有Cbow和Skip-gram两种模型，其实这并不是训练的时候用到的，这是一种选择输入和输出的方法。接下来我先介绍这两种方法。
介绍这两种方法之前有点预备工作：

在这里插入图片描述
Cbow模型：

Skip-gram模型：
Skip-gram模型与Cbow模型相反，按照它的方法构造的模型就是(3,1),(3,2),(3,4),(3,1)。

训练过程

由于公式难打就直接贴图了，下文中我会放在链接，大家可以直接看我的word
在这里插入图片描述
看到上面其实还并不是很清楚，接下来给大家看训练的模型，看完相信大家会有一个比较深的了解：

Negative sampling

在这里插入图片描述

至于为什么这样做其实我也不知道，大家可以考虑看下论文。“DisTribution Representations of Words and Phrases and Their Compositionality”（Mikolov et al.2013）

链接: link.

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

starry0001 CSDN认证博客专家 CSDN认证企业博客

码龄7年

34: 原创

39万+: 周排名

169万+: 总排名

6万+: 访问

: 等级

538: 积分

41: 粉丝

51: 获赞

42: 评论

382: 收藏

私信

关注

热门文章

分类专栏

特征交叉 3篇
Python 15篇
特征工程 2篇
机器学习 6篇
梧桐杯竞赛 1篇
灵魂拷问 2篇
spark 2篇
数据可视化 1篇
TensorFlow 5篇
NLP 3篇
问答匹配 2篇
GAN 1篇
最优化 2篇
Bert
EDA 1篇
Leetcode 1篇
MATLAB 1篇

最新评论

万字详述推荐系统经典模型DCN,DCN_v2,PNN
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客对推荐系统经典模型DCN,DCN_v2,PNN进行了详细介绍，让我受益匪浅。我觉得下一篇博客可以从实践角度来探讨DCN,DCN_v2,PNN在推荐场景中的应用，比如如何基于DCN_v2来进行广告推荐、如何基于PNN来进行商品推荐等等。这样的技术文章对其他用户也会有很大的帮助。期待你的下一篇博客，相信会有更多读者受益于你的分享。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
如何采用FM进行召回
yingzoe: FM召回中用到的用户和item的交叉类特征可以举个例子吗？这里有点难理解，什么叫是否含有相同的tag类特征？然后后面又说在精排模型中用到交叉类特征，在召回模型中不能出现，那FM召回模型中到底有没有这类特征呀？
CCF2020企业非法集资风险预测-季军方案
LIZH554: 你是怎么处理的呀，如果所有表都用，但是那些副表的数据又缺失非常多，咋办呀
CCF2020企业非法集资风险预测-季军方案
weixin_58320795: 还有数据集吗
CPLEX 在matlab中实现的一个例子-RCPSP
starry0001: 没有，官方也没有的。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。