【综述阅读】An Empirical Survey on Long Document Summarization: Datasets, Models and Metrics
学术文章和商业报告等长篇文档已成为详细说明需要特别注意的重要问题和复杂主题的标准格式。因此,一个可以有效地将长文档压缩成简短文本以封装最重要信息的自动摘要系统对于帮助读者理解具有重要意义。最近,随着神经架构的出现,人们在推进自动文本摘要系统方面做出了重大的研究努力,并且出现了许多关于将这些系统扩展到长文档领域的挑战的研究。在本次调查中,我们全面概述了长文档摘要的研究,并对其研究环境的三个主要组成部分进行了系统评估:基准数据集、摘要模型和评估指标。对于每个组成部分,我们在长文档摘要的背景下组织文献,并进行实证


