Scoring Sentence Singletons and Pairs for Abstractive Summarization

本文链接：https://blog.csdn.net/m0_64165343/article/details/124106839

中文标题：基于单句和双句打分的生成式摘要

论文链接：https://arxiv.org/pdf/1906.00077.pdf

发表：ACL 2019

组织：中佛罗里达大学

Abstract

在生成摘要的过程中，除了要对单个句子进行信息压缩和改写，更要对多个句子进行信息融合，尤其是一个句子对。作者提出对单句和双句进行联合打分，本文提出的模型能够建模人对于单句和句子对的选择方式，通过压缩和融合生成摘要。

1. Introduction

作者提到在句子选择和句子信息融合之间有一条“鸿沟”，即句子信息融合期望一个句子对或者多个句子作为输入，而句子选择只是单纯的选择单个句子，无法对句子信息进行融合。

作者首先分析了本文使用的三个数据集中的摘要和原文的关系，如下图所示：

可以看到，大部分的摘要是由单句或句子对压缩融合而来。

作者提出通过对单句和双句联合打分的方法，为句子选择和句子融合建立联系。

2. Related Work

本节作者提到了双句的重要性，双句可以承载更多的信息，并举下表例子：

3. Model

作者将单个句子和句子对都统称为一个instance，句子对不要求相邻，即对于一篇具有 $N$ 个句子的文档，有 $N+\frac{N(N-1))}{2}$ 个instance。

整个模型包含以下两个部分：

（1）对所有instance打分：

使用BERT来表示示例，因为BERT的输入既可以是一个句子，也可以是一个句子对。

由于摘要任务中句子出现的顺序会影响其重要程度（一般文档的前几句较重要），因此作者对BERT进行了一个修改，原始BERT的输入为token embedding、segment embedding和word position embedding。作者加入了一个新的输入：sentence position embedding，代表了句子位置的嵌入。作者使用BERT+fine-tune的方式，使用最后一层[CLS]标签对应的隐向量作为整个序列的表示。最后通过sigmoid函数获取其得分：

$p_{inst}=sigmoid(w^{T}h_{[CLS]]})$