【论文阅读】《GloVe: Global Vectors forWord Representation》

GloVe model

单词表示模型:GloVe,用于全局向量,全局语料的统计信息直接由模型获得。

符号

X X X:词共现矩阵
X i j X_{ij} Xij:单词 j j j出现在单词 i i i的上下文中的次数。
X i = ∑ k X i k X_i=\sum_kX_{ik} Xi=kXik:所有出现在单词 i i i的上下文中的单词次数。
P i j = p ( j ∣ i ) = X i j X i P_{ij}=p(j|i)=\frac{X_{ij}}{X_i} Pij=p(ji)=XiXij :单词 j j j出现在单词 i i i的上下文中的概率。

举例:
这里写图片描述

通过观察图中的比率(第三行)可以看出,当结果大于1时,单词 k k kice更相关,当结果小于1时,单词 k k ksteam更相关。

上述论点表明,单词矢量学习的适当起点应该是共现概率的比率而不是概率本身。其中,比率 P i k / P j k P_{ik}/P_{jk} Pik/Pjk取决于单词 i i i j j j k k k,我们采用最通用的模型形式:

(1) F ( w i , w j , w ~ k ) = P i k P j k F(w_i,w_j,\tilde{w}_k)=\frac{P_{ik}}{P_{jk}}\tag{1} F(wi,wj,w~k)=Pjk

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值