论文笔记|Get To The Point: Summarization with Pointer-Generator Networks

论文提出了一种新的文本摘要方法——指针生成网络,结合了复制和生成能力,有效解决事实细节准确性和重复生成的问题。通过覆盖机制防止重复,并在CNN/Daily Mail数据集上表现出优于其他生成模型的性能。
摘要由CSDN通过智能技术生成

该论文是ACL2017的一篇影响力较大的论文:论文地址

在这里插入图片描述

概述

抽取式文本摘要实现简单,所有内容都是从原文中抽取,但想要高质量的,足够抽象的摘要,则需要进行生成式文本摘要。
神经序列到序列模型是生成式文本摘要的一种可行的方法。然而,这些模型有两个缺点:重现事实细节不准确,重复生成。在本文工作中,作者提出了一个新的架构,以两种正交的方式增强标准的seq2seq的注意力模型。

首先,作者使用一个混合的pointer-generator网络。一边能从源文本复制单词,有助于准确地复制信息,同时可以通过生成器产生新单词。其次,作者使用覆盖机制来跟踪已经总结的内容防止重复生成。

模型

基线模型

在这里插入图片描述
上图为基线模型。原文章的token被逐个输入encoder(单层双向LSTM),产生一个编码器隐藏状态序列 h i h_i hi(相当于注意力机制中的key和value)。在每一时间步t上,decoder(单层单向LSTM)接收前一个单词的单词嵌入(训练时,这是参考摘要中的前一个单词;测试时,为decoder产生的前一个单词),decoder状态为 s t s_t st(相当于query)。其中,注意力分布的计算方法为:
在这里插入图片描述
其中, v , W h , W s , b a t t n v, W_h, W_s, b_{attn} v,Wh,Ws,b

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值