《GloVe: Global Vectors for Word Representation》笔记1

最新推荐文章于 2022-10-10 09:33:46 发布

StarLib

最新推荐文章于 2022-10-10 09:33:46 发布

阅读量762

点赞数

分类专栏： NLP 文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/StarLib/article/details/100045128

版权

《GloVe: Global Vectors for Word Representation》笔记1

motivation

在此论文之前学习单词向量表示的方式主要有两种，一种是基于计数的全局矩阵分解(global matrix factorization methods) ，一种是局部上下文窗口(local context window methods),但是这两种方法都有一定有缺点

基于计数的全局矩阵分解(global matrix factorization methods) ，比如LSA(latent semantic analysis)
- 优点：可以捕获单词的之间的相似性
- 缺点：在词类比任务上表现不行（论文作者认为是因为该方法找到的是一个次优的词向量空间）
局部上下文窗口(local context window methods) 比如 skip-gram、CBOW、ivLBL、vLBL这些模型
- 优点：在词类比任务上表现不错
- 缺点：没有利用全局共现计数的统计信息。

基于以上认识，作者提出了一个利用全局统计数据的模型 GloVe，Global Vectors。

模型推出

作者举了个例子，如下图

作者用图中的例子说明概率的比值( $\frac{P(k|ice)}{P(k|steam)}$ ),比概率( $P (k ∣ i c e), P (k ∣ s t e a m)$ )更能揭示单词之间的关系，比如ice 和solid共现的概率较高，steam和solid的共现概率较低，则 $\frac{P(k|ice)}{P(k|steam)}$ 的值大于1；ice和gas的共现概率较低，steam和gas的共现概率较高，

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。