关于句子embedding的一些工作简介(三)---- Concatenated p-mean Word Embeddings

这篇论文产生sentence embedding的方法非常简单,但是效果并不差。整个方法完全避免了深度模型,个人认为在工业界会有好的前景。由于简单易操作,尽管过去一些论文自称为hard/tough-to-beat的baseline,作者仍然把它称为一个much harder-to-beat baseline。从实际效果看,此言不虚。

贡献

最简单的求sentence embedding的方法是对句子里所有的单词embeddings求平均,但是效果差,尤其是不能和复杂的模型比(比如第一篇文章介绍的InferSent)。在这篇文章里,作者把“对word embedding求平均”的操作泛化为p-mean的一类操作,进而推广到使用不同的p值产生不同的特征。

具体的,power-means定义为:

(xp1+...+xpnn)1/p;pR{ ±} ( x 1 p + . . . + x n p n ) 1 / p ; p ∈ R ∪ { ± ∞ }

显然,当 p=1 p = 1 时,它就是取平均的操作。另外,当 p=+ p = + ∞ ,它是取最大(max)的操作,当 p= p = − ∞ 时,它是取最小值(min)的操作。作者实验了不同的 p p 值,最终的结论是以上三种操作(平均最大和最小值)放在一起使用效果会非常好。
给定一个句子的word embeddings(假设有n个词,每个embedding有d维):
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值