CS224N学习笔记（2）：skip-gram和negative sampling

最新推荐文章于 2022-03-09 07:37:38 发布

Neways谭

最新推荐文章于 2022-03-09 07:37:38 发布

阅读量697

点赞数 1

文章标签：机器学习深度学习人工智能算法 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46195663/article/details/104047393

版权

本文是CS224N学习笔记的第二部分，主要介绍了Word2Vec模型中的skip-gram算法及其优化方法negative sampling。skip-gram通过预测上下文来理解单词含义，损失函数涉及softmax计算，而negative sampling则通过采样减少计算复杂性。此外，还对比了skip-gram与基于词频统计的Glove模型，讨论了它们的优缺点和评价指标。

摘要由CSDN通过智能技术生成

CS224N学习笔记（2）

Word2Vec
- 简介
- Skip-gram
- - 定义
  - DEMO
  - 参数计算
- Negative sampling
- - 方法
  - 比较
- Glove
评价指标

Word2Vec

简介

相比Onehotting编码方式：

不能展示语义关系（不同词之间的点积为0）

修正方法：
分布相似性，通过理解上下文理解单词的含义(predict between every word and its context words)

构建dense vector来预测上下文

算法：

skip-gram
CBOW(待扩充)

所有模型都是not convex，不初始化就都会陷入局部最优化

训练优化方法：

Hierarchical softmax（待扩充）
Negative sampling

Skip-gram

定义

基于中心词（ $w_t$ )去预测上下文（ $w_{t-s}$ ， $w_{t+s}$ ，领域是radius=s)的概率分布
损失函数：
$J(\theta)=\prod_{t=1}^T \prod_{-m \leq j \leq m, j\neq 0}P(w_{t+j}|w_t;\theta)$
可以转化为:
$J(\theta) = - \frac{1}{T}\sum_{t=1}^T\sum_{-m \leq j \leq m, j \neq 0} \log P(w_{t+j}|w_t)$
其中，
$P(w_{t+j}|w_t)=P(O|C)=\frac{e^{u_o^Tv_c}}{\sum_{w=j}^v e^{(u_w^Tv_c)}}$

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
CS224N学习笔记（2）：skip-gram和negative sampling

CS224N学习笔记（2）Word2Vec简介Skip-gramWord2Vec简介相比Onehotting编码方式：不能展示语义关系（不同词之间的点积为0）修正方法：分布相似性，通过理解上下文理解单词的含义(predict between every word and its context words)构建dense vector来预测上下文算法：skip-gram...
复制链接

扫一扫

博客等级

码龄5年

23
原创

10
点赞

91
收藏

11
粉丝

关注

私信

热门文章

分类专栏

最新评论

Transformer
Neways谭: 作者调试出来的，具体代码里应用有相对简化，可以去翻下开源的代码
Transformer
Neways谭: transformer里用到了相似度计算（你觉得这篇文章有展示），是scaled-dot product，这个在我这篇文章里有说明，可以仔细看下。
Transformer
lmw0320: 另外，真的不明白，这里搞个位置编码，用个三角函数，还要做成如此复杂。。我实在不知道这种公式，是如何弄出来的。。。
Transformer
lmw0320: 为什么我看百度的一篇关于Transformer的文章:https://blog.csdn.net/longxinchen_ml/article/details/86533005, 里面根本没提到这个相似度计算的问题？
高效文本分类工具：fastText
不正经的kimol君: 写的不错，学习了，学习的道路上一起进步，也期待你的关注与支持！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。