论文阅读：Get to the point: summarization with pointer-generator networks

最新推荐文章于 2022-11-20 16:05:29 发布

咕噜咕噜day

最新推荐文章于 2022-11-20 16:05:29 发布

阅读量310

点赞数

分类专栏： nlg_paper 文章标签： pointer-net nlg

本文链接：https://blog.csdn.net/qq_36533552/article/details/105811208

版权

nlg_paper 专栏收录该内容

26 篇文章 3 订阅

订阅专栏

简介：

基于注意力机制的Seq2Seq模型，使用每一步解码的隐层状态与编码器的隐层状态计算权重，最终得到context向量，利用context向量和解码器隐层状态计算输出概率。这篇文章主要试图解决问题1、无法准确复述原文细节，无法处理不在词表中的词(oov问题) 2、生成的在摘要中存在重复的片段

Pointer-generator network模型结构图：

主要贡献点：

一、Copy mechanism：

在解码的每一步计算拷贝或生成的概率，因为词表是固定的，该机制可以选择从原文中拷贝词语到摘要中，有效的缓解了未登录词（OOV）的问题；如下图公式（8），ht∗是语境向量，st是decoder 隐层，xt是decoder输入embedding，σ是sigmoid函数，动态的计算生成概率；公式（9）再由这个概率计算最后生成的词是来词表还是encoder输入，表示对于词w，原文中所有w的attention和；