一文弄懂Word2Vec之skip-gram(含详细代码)

目录

前言

一、什么是Skip-gram算法

二、目标是什么

三、定义表示法

3.1 one-hot向量

3.2 词向量(word vector)

3.3 单词矩阵

3.4 单词相似度

3.5 softmax函数

3.6 算法过程

3.7 求softmax

四、skipgram代码实现

4.1 如何把词转换为向量

4.2 CBOW和Skip-gram的算法实现

Skip-gram的理想实现

Skip-gram的实际实现

4.3 使用Pytorch实现Skip-gram

数据处理

网络定义

网络训练


前言

本文主要参考了一篇知乎文章和一篇飞浆文章,文章末尾有注明来处,在此基础上加入了个人的理解与思考,并用自己的数据集进行了代码复现,并提出了基于知网数据集下一步的改进方向。

一、什么是Skip-gram算法

Skip-gram算法就是在给出目标单词(中心单词)的情况下,预测它的上下文单词(除中心单词外窗口内的其他单词,这里的窗口大小是2,也就是左右各两个单词࿰

  • 47
    点赞
  • 227
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 12
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dr.sky_

作者逐个题目分析的噢

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值