论文阅读 seq2seq模型的coverage机制

本文介绍了《Get To The Point: Summarization with Pointer-Generator Networks》中提出的coverage机制,旨在解决seq2seq模型生成重复片段的问题。机制通过在attention部分引入新参数ct,以记录已生成词的信息,并通过loss函数的惩罚项抑制重复生成。实验显示,该机制在CNN/Daily Mail dataset上提高了性能。
摘要由CSDN通过智能技术生成

Get To The Point: Summarization with Pointer-Generator Networks

Abigail See, Peter J. Liu, Christopher D. Manning
Standford University & Google Brain, 2017

这是ACL2017上的一篇文章,提出了coverage机制,目的是为了解决seq2seq模型生成句子中经常有重复片段的现象。

之前Statistical Machine Translation就已经存在该机制了,NMT中也有人应用了。但是这篇率先用于生成式任务。
BTW这篇文章的结构图相当好看,似乎就是用ppt做的,code也开源了:
https://github.com/abisee/pointer-generator

先看看seq2seq的结构:
这里写图片描述
再看看加coverage机制的结构图:
这里写图片描述

图中的 pgen p g e n 机制就是pointer softmax,详细可以见另一篇介绍copy机制的文章:seq2seq模型中的copy机制

整体结构和pointer generator network是一样的,需要改动的是attention的部分:

eti=vTtanh(Wh
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值