面向语法分析的word2vec修正

文献:L Wang,C Dyer, AW Black, I Trancoso. Two/Too Simple Adaptations of Word2Vec for Syntax Problems[C]. ACL 2015: 1299–1304.
https://github.com/wlin12/wang2vec

问题分析

CBOW与skip-gram在利用目标词的上下文进行其语义嵌入表示时,没有考虑上下文内的词序信息,从而使得该二者无法有效解决语法分析相关问题,这是由于 syntax关心的是“what words go where?”而语义关心的是“what words go together”。

Structured Word2Vec

这里写图片描述

  • Structured Skip-Ngram
    skip-gram模型在利用中心词 wo 预测其语境词 wc,,w1,w1,,wc 时只运用一个输出矩阵 OR|V|×d . 而在Structured Skip-Ngram中,对每个场景词 wi 分别定义一个 OiR|V|×d 。则待优化的概率转变为: p(wp=j|w=i)=exp(CpjEwi) , w=i 表示当前窗口中心词是vocabulary中的第 i 个词, wp=j表示当前窗口中心词的语境词 wp 是vocabulary中的第 j 个词. E为嵌入矩阵, Ewi 表示提取 wi 的嵌入表示, Cpj 就是第 j 个单词的输出矩阵。

  • CWINDOW
    CBOW模型是通过对上下文窗口内的各单词向量进行求和来实现中心词向量的修正,从而导致单词顺序信息丢失。而在CWINDOW中,不是以求和方式构造输出矩阵O而是以连接方式产生 O=[e(wc),,e(w1),e(w1),,e(wc)] ,这样可以保存顺序信息。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值