机器学习框架:
基于图神经网络的关系抽取:
图神经网络在图像领域的成功应用证明了以节点为中心的局部信息聚合同样可以有效的提取图像信息。
利用句子的依赖解析树构成图卷积中的邻接矩阵,以句子中每个单词为节点做图卷积操作,如此就可以抽取句子信息,再经过池化层和全连接层即可做关系抽取的任务。
基于预训练语言模型的关系抽取:
BERT+全连接层
扩展问题:实体关系联合抽取
误差传播问题:文章->实体识别与分类->关系抽取
级联三元组抽取。
基于胶囊神经网络多标签关系抽取。
多元关系抽取:Graph LSTM
拓展问题-跨句推理:
提取不同句子中单实体间的关系。
半监督学习:基于远程监督的关系抽取
远程监督的基本假设:两个实体如果在知识库中存在某种关系,则包含该两个实体的非结构化句子均可能表示出这种关系。
远程监督-基于多实例学习(降噪学习)
远程监督-基于强化学习(降噪学习)
半监督学习:基于Bootstrapping的关系抽取
Neural Snowball
属性补全:任务定义
属性知识:一个事物若干属性的取值来对这个事物进行多维度的描述
属性补全:对实体拥有的属性及属性值进行补全。
方法:抽取式;生成式。
抽取式属性补全:
抽取输入文本中的字词,组成预测的属性值,预测出的属性值一定要在输入侧出现过。
生成式属性补全:
直接生成属性值,属性值不一定在输入文本中,只要在训练数据中见过就行。
一个基于深度学习的开源中文关系抽取框架:
GitHub - zjunlp/DeepKE: [EMNLP 2022] An Open Toolkit for Knowledge Graph Extraction and Construction