NLP ——GloVe

最新推荐文章于 2024-02-28 13:39:41 发布

Cater Chen

最新推荐文章于 2024-02-28 13:39:41 发布

阅读量613

点赞数

分类专栏： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_28375239/article/details/108882394

版权

nlp 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

NLP ——GloVe

glove是一个全局对数双线性回归模型（global log bilinear regression model）。顾名思义，该模型用到了语料库的全局特征，即单词的共现频次矩阵，并且，其优化目标函数是对数线性的，并用回归的形式进行求解。本质上是对共现矩阵进行降维。
首先基于语料库构建词的共现矩阵，然后基于共现矩阵和GloVe模型学习词向量。

对于中心词：

中心词变换：
在这里插入图片描述

现在我们已经知道ice和steam这两个词在语料中出现的频率，这两个词被视为目标词（target words) ，也就是需要对它们的词向量进行学习和表征的词语。此时，我们暂且不直接去求解这两个词之间的共现关系，而是基于这两个词的频率，去探索一下其他词的条件概率是一个什么情况，这里的k就是其他词，这个条件概率记做P(k|ice)，P(k|steam)。我们观察两个条件概率的比值，也就是对于任一个k，k出现在ice的context中的条件概率，与k出现在steam的context中的条件概率，这两者之间的比值。正是基于这个朴素的道理，glove的作者决定用一个函数去拟合这个条件概率的比值，即：
在这里插入图片描述
换句话说，每个词语只有当与其他词语比较时才真正能有其意义。比如NLP中常举例的一个栗子：king - man + woman = queen，这个analogy中，我们其实并不需要实际地知道king和man等词语在实际的世界中所指称的对象（很多抽象概念甚至没有实际指称的经验对象），而是只需要知道这几个词之间的逻辑关系即可。因此，相比起绝对地描述一个词语，通过与第三者的比较，得到第三者与两个词语中的哪个更接近这样一个相对的关系，来表达词语的含义，实际上更符合我们对于语言的认知。
构建词向量和共现矩阵的近似关系：
在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
NLP ——GloVe

NLP ——GloVeglove是一个全局对数双线性回归模型（global log bilinear regression model）。顾名思义，该模型用到了语料库的全局特征，即单词的共现频次矩阵，并且，其优化目标函数是对数线性的，并用回归的形式进行求解。本质上是对共现矩阵进行降维。首先基于语料库构建词的共现矩阵，然后基于共现矩阵和GloVe模型学习词向量。对于中心词：中心词变换：现在我们已经知道ice和steam这两个词在语料中出现的频率，这两个词被视为目标词（target wo
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。