关于关系抽取的问题

TPLinker和GPLinker是两种用于序列标注的方法,主要处理实体关系识别任务。TPLinker不区分实体类型,生成2R+1个结果矩阵;GPLinker则区分实体类型,生成2R+T个结果矩阵。它们通过不同的标注方式(EH2ET, SH2OH, ST2OT)来捕捉头尾关系,矩阵中下三角区域的特殊处理使得信息更紧凑。这两种方法在自然语言处理中对于信息抽取和理解有重要作用。
摘要由CSDN通过智能技术生成

介绍一下TPLinker。

TPLinker定义三种标注EH2ET,SH2OH,ST2OT。假设序列长为N,实体类数为T个,关系类别为R个。根据标注标签生成2R+1个结果矩阵。

EH-to-ET,紫色标签,同一实体的头尾关系,是1个N×N矩阵。
SH-to-OH,红色标签,subject和object的头部token间的关系,是R个N×N矩阵。
ST-to-OT,蓝色标签,subject和object的尾部token间的关系,是R个N×N矩阵。

因为实体尾部不可能出现在头部之前,所以可以舍弃掉下三角区域,但是红标和蓝标可能出现在下三角区域,因此,可以把下三角区域的值映射到上三角,并标记为2。

TPLinker其实就是在上面这种multi-head的思想基础上,最后输出的是一个[batch, seq_len, seq_len, num_label], num_label=2R+1。

介绍一下GPLinker。

TPLinker是没有区分实体类型的,故序列长为N,实体类数为T个,关系类别为R个,则会根据标注标签生成2R+1个结果矩阵,而GPLinker是有区分实体类型的,故会根据标注标签生成2R+T个结果矩阵。其他的部分则是TPLinker差不多。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值