关系抽取相关论文笔记

a frustratingly easy approach for joint entity  and relation extraction

文章链接:https://arxiv.org/pdf/2010.12812.pdf

时间:2020.10.24挂到arxiv上

作者:陈丹琦

简介:做关系抽取的,用pipeline的方式,包括两个步骤:先训练好一个NER,然后用人工标注的数据训练关系抽取模型。其中NER是Span-level,并没有很多改进,主要改进是在关系抽取阶段。代码还没有开源。

关系抽取方面的改进:在文本中插入实体的相关信息(包括S:Subject,O:Object,以及实体的类型信息e_{i},符号表示是<S:e_{i}></S:e_{i}><O:e_{j}></O:e_{j}>,文中称这些符号为mask,这里沿用),如图1(b)所示。文本的token只能attention到文本的token,但Mask token可以attention到所有的token

但是呢,这需要对每个实体对都做一次预测,实在是太浪费时间了,所以提出了图1(c)的方法:把所有的实体对拼接到句子的后面。这样做虽然会重复一些实体,使得样本变长,但是效果会有提高,作者认为:对于不同的关系,每个实体的表示应该是不同的。

其他trick:

用到了sentence-cross,就是把上下句中的字拼接到输入中,这么做对于指代较多的样本很好。

没有让NER和RE共享参数,作者做了实验,发现共享参数会导致两个模型的f1下降,作者认为这是因为两个任务的关注的点不同,所以输入应该是不一样的。

这篇论文的优秀解读:https://zhuanlan.zhihu.com/p/274938894

读得其他论文写到了https://www.zhihu.com/people/feng-dou-dou-34-1/posts

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
关系抽取(Relation Extraction)是自然语言处理中的一个重要任务,其目的是从文本中提取实体之间的关系。 以下是一些常见的关系抽取技术: 1. 基于规则的关系抽取:这种方法使用预定义的规则或模式来识别实体和关系。例如,通过查找特定的词或短语来识别实体,并检测这些实体之间的句法或语义关系来确定它们之间的关系。这种方法的优点是解释性强,但需要大量人工定义规则或模式。 2. 基于机器学习的关系抽取:这种方法使用机器学习算法来自动识别实体和关系。一般而言,这种方法需要训练数据集,其中包含手动标注的实体和关系对,算法通过学习这些样本来自动识别新的实体和关系对。该方法的优点是可以自动适应不同类型的文本和语言,但需要足够的训练数据和高质量的标注。 3. 基于深度学习的关系抽取:这种方法使用深度神经网络来自动学习实体和关系之间的模式。例如,可以使用卷积神经网络(Convolutional Neural Network,CNN)或循环神经网络(Recurrent Neural Network,RNN)来学习实体和关系之间的语义特征,然后使用分类器来识别不同的关系类型。这种方法通常需要大量的标注数据和计算资源,但在许多任务中取得了非常好的结果。 4. 基于知识图谱的关系抽取:这种方法利用已有的知识图谱来提高关系抽取的准确性。例如,可以使用已有的实体和关系来帮助识别新的实体和关系,并通过实体之间的连接来确定它们之间的关系。这种方法的优点是可以利用已有的知识来提高准确性,但需要大量的知识图谱数据和计算资源。 这些技术通常都需要对实体和关系进行命名实体识别(Named Entity Recognition,NER)和语义角色标注(Semantic Role Labeling,SRL)等前置处理任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值