1 任务介绍
过构建标签空间来对实体和关系进行联合抽取的方法。
实体关系抽取旨在提取文本中的实体并检测它们的实体类型,以及对每个实体对检测它们的关系。作者提出了一种统一标签空间的联合抽取方法——填表法,主要是将实体检测和关系抽取两个子任务放在同一个标签空间中进行处理。针对该方法,提出了一种对应的联合解码算法(Joint Decoding Algorithm),解码出表中的实体和关系。
图中词对关系表。将文本表示为二维表结构,它具有更强的表示能力,能将所有的实体和关系都在这张表中完整得表示出来。其中,实体类型:(PER, 人名实体),(GPE, 地理位置实体);关系类型:(PER-SOC, 社会关系),(ORG-AFF, 机构附属关系),(PHYS, 位置临近关系)
在这个表中每个单元格对应于一个单词对,使用不同颜色表示不同的实体或关系类型。对角线上的正方形表示实体类型,而关系是对角线外的矩形。
表可以识别对称性和重叠关系:
- 对称性:对称的关系类型在表中关于对角线对称的,表中紫色单元格表示了两对儿对称的关系类型PER-SOC,而绿色单元格表示的PHYS和蓝色单元格表示的ORG-AFF则分别表示了两种不同的不对称关系类型。
- 重叠关系:表前两行中&#