glove 学习笔记

最新推荐文章于 2021-05-28 23:25:00 发布

trayfour

最新推荐文章于 2021-05-28 23:25:00 发布

阅读量1.1w

点赞数 2

分类专栏：机器学习自然语言处理文章标签： word2vec glove 词向量词表示

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014422406/article/details/77801243

版权

GloVe模型综合了word2vec的局部上下文建模和矩阵分解方法，通过计算词与上下文词的共现频率，构建损失函数以捕捉词汇间的关联性。其优化目标旨在保持词向量的线性关系，并考虑全局信息，广泛应用于自然语言处理任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

话不多说，入正题。

动机：

现有的词向量模型，
1 局部上下文建模的方法例如word2vector
用通俗的话来讲就是，如果两个词在训练语料中出现的上下文比较类似，比如“食堂”和“餐厅”，都在“我”，“去”，“吃饭”这种上下文上出现了许多次，那么他俩的词向量就比较相似。
2 矩阵分解的方法，例如LSA
将文档和单词的共现矩阵，也就是行是文档，列是单词，第i行第j列，表示文档i中是否包含单词j（具体是词频还是是否出现记不清楚了，不过不影响）。然后通过SVD矩阵分解的方式就能够得到两组向量，分别表示文档的向量（可以用来做文本距离）和单词的向量。（这种方法相对于word2vector的优势就是利用了词共现的信息，也就是不仅仅只关注word2vector窗口大小的上下文，而是用到了全局信息）

所以作者就想把两者都优点给结合起来。
那么想把这两个东西都利用起来，应该怎么学习词向量呢？
首先，作者计算了两个东西。记录词典维度为V
1 $X$ ( 一个 VxV的矩阵)， $X_{ij}$ 表示了词j和词i所在的上下文中出现的次数，至于上下文，就是在一定范围的窗口内（窗口大小为K）。
2

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。