中文标题:基于对话行为优化的句子门控生成式摘要模型
论文链接:https://arxiv.org/pdf/1809.05715.pdf
发表:2018 IEEE
开源链接:https://github.com/MiuLab/DialSum
组织:台大
Abstract
在对话中,不同的说话者之间有多种互动模式,称为对话行为。互动信号能够为对话摘要提供信息线索。本文设计了一个句子门控机制来建模对话行为摘要之间的关系。在会议数据集AMI中取得了很好的效果。
1. Introduction
作者指出之前的研究重点关注文本中提及的突出内容,而不关注交互状态的信息来进行摘要。作者认为这种交互行为的信号应该也是很重要的,本文工作的重点为如何有效应用对话行为的信息。
2. Dialogue Summarization Dataset
本文基于AMI会议数据集构建了一个新的对话摘要数据集。AMI数据集有丰富的annotation(对话行为、命名实体、话题描述等),其中话题描述被当作摘要来处理。作者利用滑动窗口将AMI数据集切分为多个对话样本,作者最终提取了7824个样本,7024个样本用来训练,400个验证,400个测试。具体的数据集示例和数据集统计数据如下图表所示: