论文笔记--GloVe: Global Vectors for Word Representation

最新推荐文章于 2025-02-04 05:00:00 发布

Isawany

最新推荐文章于 2025-02-04 05:00:00 发布

阅读量1.8k

点赞数 1

分类专栏：论文阅读文章标签：论文阅读 word2vec GloVe nlp 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38124427/article/details/131968100

版权

论文笔记--GloVe: Global Vectors for Word Representation

1. 文章简介
2. 文章概括
3 文章重点技术
4. 文章亮点
5. 原文传送门
6. References

1. 文章简介

标题：GloVe: Global Vectors for Word Representation
作者：Jeffrey Pennington, Richard Socher, Christopher D. Manning
日期：2014
期刊：EMNLP

2. 文章概括

文章提出了一种新的单词表示的训练方法：Glove。该方法结合了基于统计方法和基于上下文窗口方法的优势，在多个下游任务上超越了当下SOTA方法的表现。

3 文章重点技术

3.1 两种常用的单词向量训练方法

现有的两类常用的单词向量训练方法为

基于矩阵分解的方法，如LSA会首先计算一个term-document矩阵，每一列表示每个文档中各个单词的出现频率，然后进行奇异值分解；HAL则会首先计算一个term-term共现矩阵。但此类方法会被频繁出现的the, and等单词影响，计算相似度的时候该类对语义影响很小的单词会占较大的比重。
基于上下文窗口的方法，如Word2Vec[1]。此类方法没有用到语料中的统计信息，可能无法捕捉到数据中的重复现象。

3.2 GloVe

为了解决上述两种方法存在的问题，文章提出了一种Global Vectors(GloVe)单词嵌入方法，可以直接捕获语料中的统计信息。
首先，我们计算单词共现矩阵 $X$ ，其中 $X_ij$ 表示单词 $j$ 出现在单词 $i$ 的上下文的次数。令 $X_i = \sum_k X_{ik}$ 表示任意单词出现在单词 $i$ 上下文的总次数，则 $P_{ij} = \frac {X_ij}{X_i}$ 表示单词 $j$ 出现在单词 $i$ 的上下文的概率。
为了得到每个单词的嵌入 $w_i$ ，文章首先需要假设一种嵌入 $w_i, w_j$ 和共现矩阵之间的关系式。为此，文章给出一个示例：如下表所示，假设考虑单词i=“ice”，j=“steam”，则k="solid"时，由于"solid"和"ice"相关性更高，所以 $P_{ik}/P_{jk}$ 应该大一点，下表中实验结果为8.9；如果k=“gas”，和"steam"的相关性更高，从而 $P_{ik}/P_{jk}$ 应该小一点，下表中实验结果为 $8.5 \times 10^{-2}$ ；如果k="water"和二者均相关或k="fashion"和二者均不相关，则 $P_{ik}/P_{jk}$ 应该接近1，如下表中的 $1.36$ 和 $0.96$ 。
cooccur
为此，文章选择通过单词

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。