A Deep Reinforced Model for Abstractive Summarization

A Deep Reinforced Model for Abstractive Summarization

Romain Paulus, Caiming Xiong, and Richard Socher. 2017.A Deep Reinforced Model for Abstractive Summarization

官方博客介绍

Introduction

本周读的是Salesforce研究发表的关于自动文本摘要的论文,自动文本摘要主要分成抽取式和生成式,抽取式主要是从原文中找到和主题相关的句子或短语,然后组合成摘要,有点类似“复制粘贴”的模式;而生成式主要是在理解了原文的基础上,对原文进行抽象,然后用语义相近的词或者不同表述方法进行文本摘要,更符合人类的形式。但是长文本生成摘要过程中,经常出现不连贯不相关内容、重复语句等问题,基于这些问题,论文中使用了很多trick,包括融合了改进的attention机制和强化学习的训练方法,结果在CNN/Daily Mail、New York Times数据集上达到了新的state-of-the-art。

Model

论文的主要框架还是Seq2Seq,输入是原文文本,输出是文本摘要,encoder采用bi-LSTM,decoder采用单层LSTM。
这里写图片描述

  • A new Attention and Decoding Mechanism

    文中使用了两套attention机制,Intra-temporal attention和Intra-decoder attention。前者是作用在encoder中上的,对input中每个词计算权重,这样能使生成的内容信息覆盖原文。后者是作用在decoder上的,对已经生成的词也计算权重,这样能够避免生成重复的内容。然后两者拼接起来进行decode生成下一个词。如下图所示:

    这里写图片描述

    在计算Intra-temporal attention权重的过程中,论文采用了一种方法对input中获得较高权重的词进行惩罚,以防后面decode过程中再次赋予该词高权重。计算公式如下,decoder的Intra-decoder attention权重计算则少了以下第二个公式。

    eti=hdtTWeattnhei

eti=exp(eti)exp(eti)
  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
《Reinforced concrete structures》是1975年R. Park和T. Paulay所著的一本关于钢筋混凝土结构的书籍。这本书被公认为将Strut-and-tie模型引入设计领域的开山之作。该书提供了关于钢筋混凝土结构设计的重要知识和理论,但在网上查找这本书可能会比较困难。 关于提取向量化信息和更新节点表示的方法,可以使用相邻节点中提取的信息进行聚合,并递归地更新自身节点的表示。其中,z^l_v是节点v在第l层之后的表示,初始时用x_v进行初始化。聚合函数和更新函数分别表示了信息的聚合和更新过程。 在边的关系中,通常会忽略边之间的从属关系。大多数解释器在探测边属性和构造解释子图时独立绘制边的属性。然而,事实上,边通常相互协作,并与其他边协作以逼近决策边界。这种高度依赖的边缘形成了一个联盟,可以在模型中建立一个原型来做出决策。例如,在化学领域中,N=O键形成的硝基(NO2)是一个典型的联盟,负责突变性和预测准确性的提高。因此,对于模型预测的解释,N=O键可以提供更好的事后解释。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Reinforced concrete structures_reinforced_书籍_ConcreteStructures_](https://download.csdn.net/download/weixin_42681774/27438078)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Reinforced Causal Explainer for Graph Neural Networks 图神经网络的增强因果解释器](https://blog.csdn.net/feijianguoer/article/details/129710966)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值