深度学习NLP笔记（三）：GloVe模型

最新推荐文章于 2024-09-10 00:45:00 发布

二伟在努力

最新推荐文章于 2024-09-10 00:45:00 发布

阅读量1.5k

点赞数 1

分类专栏：深度学习NLP 文章标签：深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39527549/article/details/84933227

版权

GloVe模型利用词的共现信息来构建词向量，通过概率比值表达词之间的关系。文章介绍了如何通过共现矩阵计算词共现概率，展示了如何构造标量函数并引入偏移向量解决不对称问题，最后提出了基于损失函数的优化目标，以更好地捕获词频统计信息。

摘要由CSDN通过智能技术生成

GolVe模型使用了词与词的共现信息。定义X为共现矩阵，则x_ij为词j出现在词i环境中的次数。令 $x_{i}=\sum_{k}x_{ik}$ 为任意词出现在词i环境中的次数，则：
$P(ij)=P(j|i)=\frac{x_{ij}}{x_{i}}$
　　P(ij)为词j出现在词i环境中的概率，也成为词i和词j的共现概率。
　　例如，对于语料：

I like deep learning.
I like NLP.
I enjoy flying.
可以得到共现矩阵：

可以得到 $P('I','like')=\frac{2}{3}$
那么共现概率到底有什么用呢？举一个例子。

w_k	“solid”	“gas”	“water”
$p_{1}=P(w_{k} \mid "ice")$	0.00019	0.000066	0.003
$p_{2}=P(w_{k} \mid "steam")$	0.000022	0.00078	0.0022
$p_{1}/p_{2}$	8.9	0.085	1.36

从直观上我们知道，“solid”和"ice"很接近，但是和"steam"相差很远，因此

最低0.47元/天解锁文章

二伟在努力 CSDN认证博客专家 CSDN认证企业博客

码龄7年

11: 原创

120万+: 周排名

118万+: 总排名

1万+: 访问

: 等级

310: 积分

9: 粉丝

10: 获赞

11: 评论

39: 收藏

私信

关注

热门文章

分类专栏

最新评论

将pcap文件处理成KDD99数据集格式
普通网友: 你好，问题解决了吗，可以提取出来吗
将pcap文件处理成KDD99数据集格式
guessMeWho: 你好啊，请问这个问题解决了吗？
将pcap文件处理成KDD99数据集格式
Tiamo_wey: 老板您好，请问您现在这个问题解决了吗？能提取出41项特征了吗？？谢谢！
将pcap文件处理成KDD99数据集格式
weixin_42146182: 兄弟你好啊，请问这个问题解决了吗
将pcap文件处理成KDD99数据集格式
本杰明刘能: C:\Program Files (x86)\Microsoft Visual Studio\2017\Community\Common7\IDE>cmake D:\kdd99_feature_extractor-master\CMakeLists.txt -- Selecting Windows SDK version 10.0.17763.0 to target Windows 10.0.18362. -- Could NOT find PCAP (missing: PCAP_INCLUDE_DIR PCAP_LIBRARY) -- ENV{PCAPDIR}= -- PCAP_FOUND=FALSE -- PCAP_LIBRARIES= -- PCAP_INCLUDE_DIR=PCAP_INCLUDE_DIR-NOTFOUND CMake Error: The following variables are used in this project, but they are set to NOTFOUND. Please set them or make sure they are set and tested correctly in the CMake files: PCAP_INCLUDE_DIR used as include directory in directory D:/kdd99_feature_extractor-master/src used as include directory in directory D:/kdd99_feature_extractor-master/src -- Configuring incomplete, errors occurred! See also "D:/kdd99_feature_extractor-master/CMakeFiles/CMakeOutput.log". See also "D:/kdd99_feature_extractor-master/CMakeFiles/CMakeError.log". windows10下用vs2017添加了command prompt后还是不行

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。