从一开始的Google搜索,到现在的聊天机器人、大数据风控、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。本文通过分享企业知识图谱落地案例,以通俗易懂的方式来讲解知识图谱是如何帮助企业快速解决问题的。
1、什么是知识图谱?
知识图谱,如下图所示,每个节点代表现实世界中的某个实体,它们的连边上标记实体间的关系。
这样,2019新型冠状病毒感染肺炎的相关知识就以结构化的形式记录下来。
数据角度:是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是”实体-属性-关系”,构成网状的知识结构,融合碎片化的信息,建立领域知识模型,挖掘复杂的关联关系和传递影响,辅助智能决策。
技术角度:是一套工程技术,包括知识抽取、知识表示、知识存储、知识推理、知识检索、知识问答等一系列技术
(营养健康知识图谱)
2、知识抽取
知识抽取是实现自动化构建大规模知识图谱的重要技术,其目的在于从不同来源、不同结构的数据中进行知识提取并存入知识图谱中。
知识抽取的概念最早在 20 世纪 70 年代后期出现于 NLP 研究领域,是指自动化地从文本中发现和抽取相关信息,并将多个文本碎片中的信息进行合并,将非结构化数据转换为结构化数据。(如图1)
(图1)
知识抽取子任务(如图2):
1、命名实体识别: 发现实体名称,并将其进行分类
2、实体关系抽取