手把手带你弄清楚Word2Vec训练过程

由于这个排班玩不来,贴上word文档的链接
https://pan.baidu.com/s/1mMEWk1_v31s_AfJPAwgsYQ 提取码:d6vm
Word2Vec是自然语言处理中最基本的内容,对于初学者来说可能并不怎么好理解。这个内容我断断续续地学了几次,每次都有不少的收获,现在差不多读懂了,因此将其完整地表述出来,供各位入门者学习,希望可以帮助到大家。

训练数据获取

大家可能都听过Word2Vec有Cbow和Skip-gram两种模型,其实这并不是训练的时候用到的,这是一种选择输入和输出的方法。接下来我先介绍这两种方法。
介绍这两种方法之前有点预备工作

在这里插入图片描述
Cbow模型
在这里插入图片描述
Skip-gram模型
Skip-gram模型与Cbow模型相反,按照它的方法构造的模型就是(3,1),(3,2),(3,4),(3,1)。

训练过程

由于公式难打就直接贴图了,下文中我会放在链接,大家可以直接看我的word
在这里插入图片描述
看到上面其实还并不是很清楚,接下来给大家看训练的模型,看完相信大家会有一个比较深的了解:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Negative sampling

在这里插入图片描述
在这里插入图片描述
至于为什么这样做其实我也不知道,大家可以考虑看下论文。“DisTribution Representations of Words and Phrases and Their Compositionality”(Mikolov et al.2013)

链接: link.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值