word2vec

word2vec 数学推导

word2vec 是一种训练词向量的工具,可以将词库中的所有词语映射到 \(k\) 维的向量中。主要有两种训练方式,CBOW 和 skip-gram,CBOW 根据上下文来预测目标单词,skip-gram 根据目标单词来预测上下文。下面进行两种方式的数学推导。

CBOW

1. One-word context

cbow
假设词表大小为 \(V\),隐藏层大小为 \(N\),input-hidden 权重矩阵为 \(W_{V*N}\),其中第 \(k\) 行的转置为 \(v_k\),hidden-output 的权重矩阵为 \(W'_{N*V}\),其中第 \(j\) 列为 \(v'_j\)。计算过程如下:
\[h = v_k\]
\[u_j = {v'_j}^T * h\]
后验概率为:\(p(w_j|w_I) = y_j = \frac{exp(u_j)}{\sum_{j'=1}^{V}exp(u_{j'})}\),使用交叉墒损失函数:
\[E = -\sum_{j=1}^{V}\widehat{y}_jlogy_j = -\sum_{j=1}^{V}\widehat{y}_j(u_j - log(\sum_{j'=1}^{V}exp(u_{j'})))\]
\(E\)\(u_j\) 求导:
\[\frac{\partial{E}}{\partial{u_j}} = y_j - \widehat{y}_j\]
即预测概率值与真实概率值的差。

转载于:https://www.cnblogs.com/herokk/p/11210928.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值