Learning the Extraction Order of Multiple Relational Facts in a Sentence with Reinforcement Learning

在这里插入图片描述

Abstract

现有的方法中没有考虑到相关事实的提取和整理,多重关系提取任务尝试从句子中提取所有关系事实,本文认为提取顺序在此任务中至关重要,为了考虑提取顺序,文本将强化学习应用到Seq2Seq模型中,所提出的模型可以自由生成关系事实。

model

在这里插入图片描述
通过双向RNN对句子进行编码,再通过另一个RNN逐个生成三元组,当所有有效的三元组生成后,解码器将生成NA三元组。
在时间步长t中,需要三步生成三元组:

  • t%3 =1:预测该关系
  • t%2=2:复制第一个实体
  • t%3=0:复制第二个实体

Reinforcement Learning Process

  • state: s t = ( y ∧ < t , x , θ ) s_t=(\overset{\wedge}{y}^{<t},x,\theta) st=(y<t,x,θ)
  • aciton: 该action是在每个时间步中预测的动作,在时间步t和t%3=1是,需要模型来确定三元组的关系;在t%3=2或0的时间步t中,需要模型来确定第一个或第二个实体,该实体是从源语句中复制的
  • reward:
    在这里插入图片描述

Result

在这里插入图片描述

启示

  1. 引入了强化学习,只可惜我不会,但是这个分数直接提升了十个点着实有点让人意想不到,有大佬可以看看接着往下做
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值