关于句子embedding的一些工作简介（三）---- Concatenated p-mean Word Embeddings

最新推荐文章于 2024-04-26 08:52:59 发布

triplemeng

最新推荐文章于 2024-04-26 08:52:59 发布

阅读量3k

点赞数 2

分类专栏：深度学习，人工智能句子嵌入自然语言处理，注意力模型句子embedding 文章标签：句子embedding embedding 深度学习 NLP InferSent

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/triplemeng/article/details/81298100

版权

这篇论文产生sentence embedding的方法非常简单，但是效果并不差。整个方法完全避免了深度模型，个人认为在工业界会有好的前景。由于简单易操作，尽管过去一些论文自称为hard/tough-to-beat的baseline，作者仍然把它称为一个much harder-to-beat baseline。从实际效果看，此言不虚。

贡献

最简单的求sentence embedding的方法是对句子里所有的单词embeddings求平均，但是效果差，尤其是不能和复杂的模型比(比如第一篇文章介绍的InferSent)。在这篇文章里，作者把“对word embedding求平均”的操作泛化为p-mean的一类操作，进而推广到使用不同的p值产生不同的特征。

具体的，power-means定义为：

(x p 1 + . . . + x p n n) 1 / p; p \in R \cup {\pm \infty}

$(\dfrac{x_1^p+...+x_n^p}{n})^{1/p}; p\in R \cup \{\pm\infty\}$
显然，当

p=1 p = 1 $p=1$ 时，它就是取平均的操作。另外，当

p=+∞ p = + ∞ $p=+\infty$ ，它是取最大(max)的操作，当

p=−∞ p = − ∞ $p=-\infty$ 时，它是取最小值(min)的操作。作者实验了不同的

p p $p$ 值，最终的结论是以上三种操作（平均最大和最小值）放在一起使用效果会非常好。
给定一个句子的word embeddings(假设有n个词，每个embedding有d维):

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
关于句子embedding的一些工作简介（三）---- Concatenated p-mean Word Embeddings

这篇论文产生sentence embedding的方法非常简单，但是效果并不差，算是极简主义的一次胜利。由于其简单易操作，尽管过去由一些论文自称为hard/tough-to-beat的baseline，作者把自己的工作称为一个much harder-to-beat baseline。从实际效果看，此言不虚。最简单的求sentence embedding的方法是对句子里所有的单词embeddin...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。