【论文】PARADE: 段落表示聚合文档

Elffffffff

已于 2022-09-24 11:06:40 修改

阅读量240

点赞数

文章标签：自然语言处理

于 2022-04-27 08:01:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/elf1110/article/details/124406261

版权

PARADE: Passage Representation Aggregationfor Document Reranking

论文链接：https://arxiv.org/pdf/2008.09093.pdf

ABSTRACT

将文档段落中的相关信号聚合成最终排名分数的策略，称这种新方法为 PARADE。

INTRODUCTION

PLM 通常会限制序列的长度（例如，限制为 512 个标记）以降低计算成本。因此，当应用于临时排名任务时，PLM 通常用于预测段落或单个句子的相关性。然后聚合最大或最大通过分数（例如，前 3 个）以产生文档相关性分数。

实验表明，聚合段落级别的相关性分数来预测文档的相关性分数优于使用最大段落分数的常见做法。

RELATED WORK

Contextualized Language Models for IR

Passage-based Document Retrieval.

Representation Aggregation Approaches for NLP

Knowledge Distillation

METHOD

段落分数聚合如图a，段落表示聚合如图b。

表示聚合的几种方式如上图所示。

对段落的[cls]进行表示聚合，进而表达文档得分。其中通过transformer聚合的效果最好。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文】PARADE: 段落表示聚合文档

PARADE: Passage Representation Aggregationfor Document Reranking论文链接：https://arxiv.org/pdf/2008.09093.pdfABSTRACT探索了将文档段落中的相关信号聚合成最终排名分数的策略，称这种新方法为 PARADE。INTRODUCTIONPLM 通常会限制序列的长度（例如，限制为 512 个标记）以降低计算成本。因此，当应用于临时排名任务时，PLM 通常用于预测段落或单个句子的相关性。然
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。