(八十四):A Hierarchical Network for Abstractive Meeting Summarization with Cross-Domain Pretraining
- 出处: EMNLP (Findings) 2020: 194-203
- 代码:https://github.com/microsoft/HMNet
- 题目:用于抽象会议摘要的跨领域预训练的分层网络
- 主要内容:在本文中,我们提出了一种适应会议场景的抽象摘要网络。
1、设计了一个层次结构来容纳冗长的会议记录;
2、设计了一个角色向量来描述发言者之间的差异;
3、由于会议摘要数据的不足,在大规模新闻摘要数据上对模型进行了预训练。
Abstract
随着自动会议文本的大量出现,会议摘要成为与会者和其他各方都非常感兴趣的内容。传统的会议汇总方法依赖于复杂的多步骤流程,使得联合优化变得棘手。与此同时,还有一些用于文本摘要和对话系统的深层神经模型。然而,会议记录的语义结构和风格与文章和对话有很大的不同。在本文中,我们提出了一种新的抽象摘要网络,以适应会议场景。
- 我们设计了一个层次结构来适应长时间的会议记录,并设计了一个角色向量来描述发言者之间的差异。
- 此外,由于会议纪要数据的不足,我们在大规模新闻纪要数据上对模型进行了预训练。
- 实证结果表明,我们的模型在自动评价和人工评价两方面都优于以往的方法。例如