【文献阅读笔记】02-用多轮问答框架进行实体关系联合抽取

【文献阅读】02-用多轮问答框架进行实体关系联合抽取-Entity-Relation Extraction as Multi-turn Question Answering

1 Introduction

1.1 实体关系联合抽取

  实体关系抽取任务:提取具有语义关系的实体对,即三元组; 是信息提取的中心任务,需要从非结构化文本自动构建知识 。
在这里插入图片描述
实体关系抽取目前两种常见解决方案

Pipeline:早期的信息抽取将实体抽取和关系抽取看作两个独立的任务,这样的串联模型在建模上相对更简单。但这样将实体识别和关系抽取当作两个独立的任务会导致一些问题:比如误差积累、实体冗余、关系重叠问题等等 。

联合抽取:对实体抽取和关系分类联合建模,能够利用实体和关系之间的交互信息,同时抽取实体并分类实体对的关系,可以很好地解决流水线方法所存在的问题。

文章认为目前的方法依然存在一些问题
算法层面:1.实体距离远 2.实体共享问题 3.关系跨度重叠问题
任务形式:三元组对未充分表达文本背后的数据结构

1.2 文章工作

在这里插入图片描述
  以这段语料为例,标签之间存在层次依赖关系:比如职位的抽取依赖于时间,因为一个人可以在不同的时间段内担任公司的多个职位;职位的抽取也依赖于公司,因为一个人可以在多家公司任职。
  这样的例子在真实情景下是常见的: 所以文章把提取目标从三元组延伸到了数据表,提取出的信息对语料表达的更加全面。

文章提出新方法解决实体关系抽取问题

将关任务转换为多轮问答任务(Multi QA):每个实体类型和关系类型由问答模板表征 实体和关系通过回答对应的模板问题来提取 ,答案是文本跨度,使用机器阅读理解(MRC)框架提取 。

在这里插入图片描述

Multi QA方法优势
1.提供了更好的方式捕获标注的层级依赖
2.问题查询编码了想要识别的关系类型的重要先验知识
3.提供了一种同时提取实体和关系的自然方式

2 MULTI-QA

2.1系统框架

在这里插入图片描述

整个抽取过程分为两个阶段

1)头实体抽取阶段(4-9行)
多轮问答的每个步骤均由一个实体触发,为了抽取这个头实体,用EntityQuesTemplates(第四行)将每个实体类型转化为一个问题;
实体 e 1 e_1 e1</

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值