简介
TPLinker融合了多头multi-head抽取范式(创建token-pair的矩阵)+ 标注方式(定义三种标注EH2ET,SH2OH,ST2OT的标签)的思想,有些巧妙。
假设序列长为N,实体类数为T个,关系类别为R个,则会根据标注标签生成2R+1个结果矩阵,TP_Linker其实就是在上面这种multi-head的思想基础上,最后输出的是一个[batch, seq_len, seq_len, num_label], num_label=2R+1
TPLinker的标注方式:
1). entity head to entity tail (EH-to-ET):紫色标注,表示同一实体的头尾关系,是1个N×N矩阵,如两个实体:New York City:M(New, City) =1; De Blasio:M(De, Blasio) =1。
2). subject head to object head (SH-to-OH):红色标注 表示subject和object的头部token间的关系,是R个N×N矩阵,如三元组(New York City, mayor,De Blasio):M(New, De)=1。
3). subject tail to object tail (ST-to-OT):蓝色标注 表示subject和object的尾部token间的关系,是R个N×N矩阵,如三元组(New York City,