一文打尽知识图谱

最新推荐文章于 2022-12-01 16:41:21 发布

NLP论文解读

最新推荐文章于 2022-12-01 16:41:21 发布

阅读量1.4k

点赞数 5

文章标签：知识图谱人工智能

本文链接：https://blog.csdn.net/NLPlunwenjiedu/article/details/123204991

版权

©原创作者 | 朱林

01 序言

知识是人类在实践中认识客观世界的结晶。知识图谱（Knowledge Graph, KG）是知识工程的重要分支之一，它以符号形式结构化地描述了物理世界中的概念及其相互关系。

知识图谱的基本组成形式为<实体,关系,实体>的三元组，实体间通过关系相互联结，构成了复杂的网状知识结构。

图1 知识图谱组成复杂的网状知识结构

知识图谱从萌芽思想的提出到如今已经发展了六十多年，衍生出了许多独立的研究方向，并在众多实际工程项目和大型系统中发挥着不可替代的重要作用。

如今，知识图谱已经成为认知和人工智能日益流行的研究方向，受到学术界和工业界的高度重视。

本文对知识图谱的历史、定义、研究方向、未来发展、数据集和开源库进行了全面的梳理总结，值得收藏。

02 简史

图2 知识库简史

图2展示了知识图谱及其相关概念和系统的历史沿革，其在逻辑和人工智能领域经历了漫长的发展历程。

图形化知识表征（Knowledge Representation）的思想最早可以追溯到1956年，由Richens首先提出了语义网（Semantic Net）的概念。

逻辑符号的知识表示形式可以追溯到1959年的通用问题求解器（General Problem Solver, GPS）。

20世纪70年代，专家系统一度成为研究热点，基于知识推理和问题求解器的MYCIN系统是当时最著名的基于规则的医学诊断专家系统之一，该专家系统知识库拥有约600条医学规则。

此后，20世纪80年代早期，知识表征经历了Frame-based Languages、KL-ONE Frame Language的混合发展时期。

大约在这个时期结束时的1984年，Cyc项目出现了，该项目最开始的目标是将上百万条知识编码成机器可用的形式，用以表示人类常识，为此专门设计了专用的知识表示语言CycL，这种知识表示语言是基于一阶关系的。该项目有极大的野心，但是手动录入、概念属性模糊等缺陷也遭受了许多非议。

20世纪末，资源描述框架（Resource description framework, RDF）、Web本体语言（Web Ontology Language, OWL）相继发布，成为语义网的重要标准。随后，越来越多开放的知识库或本体陆续发布，例如WordNet、DBpedia、YAGO和Freebase。

2012年，知识图谱这一概念由Google首次提出并得到广泛接受，更多通用领域和特定领域的知识图谱相继发布。

自此，知识图谱逐渐成为一个独立的研究领域，得到学术界和工业界的极大重视，并由此推动了包括知识表征、知识获取、知识推理、知识应用的研究，在自然语言处理、人工智能及其他交叉领域里发光发亮。

03 定义

学术界目前缺乏一个被普遍接受的严格定义，大多数定义是通过形式化描述知识图谱的一般语义表示或基础特征来给出定义。下面提供两条相对准确的定义以供参考。

定义1（Ehrlinger et al.）：A knowledge graph acquires and integrates information into an ontology and applies a reasoner to derive new knowledge. 知识图谱获取信息并将其集成到本体中，并应用推理器来获取新知识。

定义2（Wang et al.）：A knowledge graph is a multi-relational graph composed of entities and relations which are regarded as nodes and different types of edges, respectively. 知识图谱是由实体和关系组成的多关系图，实体和关系分别被视为节点和不同类型的边。

04 符号描述

表1 知识图谱中常见的符号描述

05 研究方向

知识图谱目前的研究方向可以大致分为四类：知识表征学习（Knowledge Represent Learning, KRL）、知识获取（Knowledge Acquisition）、时序知识图谱（Temporal Knowledge Graph, TKG）和应用（Knowledge-aware Applications）。

图3展示了知识图谱的主要研究方向分支图，图中详细罗列了相关领域的承继关系。