知识抽取的概念 知识抽取,即从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱。大体的任务分类与对应技术如下图所示: 知识抽取子任务 实体识别与链接 实体识别即识别出句子或文本中的实体,链接就是将该实体与知识库中的对应实体进行链接。其中涉及到了实体的识别与消岐技术。实体识别技术刚刚介绍过,下面把重点放在实体链接部分。 实体链接的流程如下图所示: 关系抽取分类 联合训练 结构化数据抽取 ON top 关系数据映射到 得到虚拟的RDF,可用SPARQL 来查询 ** 面向非结构化数据抽取 ** 佛学知识体系建立