point-generator network and Coverage mechanism for summary

论文来自: Get To The Point: Summarization with Pointer-Generator Networks

传统的神经方法不能处理OOV以及解码时的重复问题。这篇文章提出point网络用来解决OOV问题,coverage用来解决重复问题。


1. point-generator network

解码时用到的vocabulary是这个batch里的词组成,且是频率从高到低的N-Size个词,这个batch里的其他词不放入vocabulary里,比如超低频词。
这里写图片描述

注意这里P代表的是一个soft switch 而不是一个hard switch。由公式(7)可知,解码生成某个词的概率由两部分组成,第一个是生成模式生成这个词的概率;第二个是从源句子里抽取某个词的概率。公式七里有几个要解释的点:

  • ati 表示源句子中每个位置的attention score
  • i:wi=w 表示源句子中和词w相同的位置

这里写图片描述

如果w是个OOV词,则Pvoc(w)就等于0;如果w没有出现在源文档中,则公式7左边的第二个components就等于0


这里写图片描述


2. Coverage mechanism

这里写图片描述

This ensures that the attention mechanisms current decision (choosing where to attend next) is informed by a reminder of its previous decisions。This should make it easier for the attention mechanism to avoid repeatedly attending to the same locations, and thus avoid generating repetitive text.


这里写图片描述

两个向量相应位置处的元素取最小值,然后在向量上求和。上面公式里的a(i,t)代表解码第i个词时对应的attention soce,用他来和C做比较。the final loss function(下面公式单个step的loss):
这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yiqingyang2012

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值