ACL 2017| 指针生成网络：自动生成长段文本的抽象摘要

最新推荐文章于 2024-08-12 11:44:04 发布

a609640147

最新推荐文章于 2024-08-12 11:44:04 发布

阅读量767

点赞数

文章标签：人工智能论文

本文链接：https://blog.csdn.net/a609640147/article/details/89532782

版权

Point-Generator网络可以被视为提取和抽象方法之间的平衡，类似于Gu等人（2016）CopyNet和Miao and Blunsom（2016）强制注意句子压缩，适用于短文本摘要。文章提出了神经机器翻译的覆盖向量的新变体（Tu et al，2016），用它来跟踪和控制源文档的覆盖范围，覆盖率对于消除重复非常有效。

论文地址:
https://arxiv.org/abs/1704.04368

引言

摘要是将每个文本压缩到包含原始主要信息的较短版本的任务。摘要有两种方法：提取和抽象。提取方法仅从源文本中的段落（通常是整个句子）汇总，而抽象方法能生成源文本中没有的新单词和短语。

数据集

使用CNN /每日邮报数据集（Hermann等，2015; Nallapati等，2016），其中包含在线新闻文章（平均781个令牌）与多句话摘要（平均3.75个句子或56个令牌）配对使用了Nallapati等人提供的脚本。（2016）获得相同版本的数据，具有287,226个训练对，13,368个验证对和11,490个测试对。
ROUGE F1 and METEOR 得分