Glove词向量核心内容介绍--NLP

最新推荐文章于 2024-08-04 07:45:00 发布

kasiko

最新推荐文章于 2024-08-04 07:45:00 发布

阅读量888

点赞数 1

分类专栏： NLP 文章标签：人工智能深度学习 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kasiko/article/details/107369539

版权

GloVe是一种基于全局词频统计的词表征工具，常用于计算文本相似性。它通过构建共现矩阵，然后利用平方损失函数训练词向量。训练过程包括构建矩阵、建立向量关系和优化目标函数。GloVe使用AdaGrad优化，对于不同大小的vector，迭代次数不同，最终得到的词向量是两个矩阵的和。

摘要由CSDN通过智能技术生成

Glove

尽管现在基于transformer的巨型模型也可以得到词向量。但是在一些基础的计算文本相似的任务中传统的静态词向量依然是非常好用的。Glove就是其中的一个代表。

2014年， Empirical Methods in Natural Language Processing (EMNLP)的论文：GloVe: Global Vectors for Word Representation 介绍了这种词向量。

正如论文的名字一样，GloVe是一个基于全局词频统计（count-based & overall statistics）的词表征（word representation）工具，它和word2vec一样，把一个单词表达成一个低维稠密向量，可以通过余弦相似度等计算单词之间的相似性。

怎样训练Glove?

Glove 的训练过程比较简单，可以分为3步：

step1:
根据语料库（corpus）构建一个共现矩阵（Co-ocurrence Matrix）X，矩阵中的每一个元素代表单词和上下文单词在特定大小的上下文窗口内共同出现的次数。

通常来说，次数最小是1，但是GloVe根据两个单词在上下文窗口的距离，提出了一个衰减函数， $decay=\frac{1}{d}$ 用于计算权重，也就是说距离越远的两个单词所占总计数的权重越小。

在这里插入图片描述

Step2:

构建词向量（Word Vector）和共现矩阵（Co-ocurrence Matrix）之间的近似关系，作者用了下面的公式：

$W_{i}^{T}W_{j}+b_{i}+b_{j} = log(X_{ij})$

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Glove词向量核心内容介绍--NLP

Glove尽管现在基于transformer的巨型模型也可以得到词向量。但是在一些基础的计算文本相似的任务中传统的静态词向量依然是非常好用的。Glove就是其中的一个代表。2014年， Empirical Methods in Natural Language Processing (EMNLP)的论文：GloVe: Global Vectors for Word Representation 介绍了这种词向量。正如论文的名字一样，GloVe是一个基于全局词频统计（count-based &
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。