名词解释
- 语义网(Semantic Web)
Tim.Lee在1998年提出的一个新概念,描述互联网中资源和数据之间的关系,使得互联网上的数据变得机器可读,常被用来指代一整套技术栈框架。
- 知识图谱
知识图谱本质上是语义网络(Semantic Network)的知识库,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。
- RDF(Resource Description Framework),资源描述框
RDF(Resource Description Framework,资源描述框架),是W3C在XML的基础上推荐的一种标准,用于表示任何的资源信息。RDF提出了一个简单的模型用来表示任意类型的数据。这个数据类型由节点和节点之间带有标记的连接弧所组成。节点用来表示Web上的资源,弧用来表示这些资源的属性。因此,这个数据模型可以方便的描述对象(或者资源)以及它们之间关系。RDF的数据模型实质上是一种二元关系的表达,由于任何复杂的关系都可以分解为多个简单的二元关系,因此RDF的数据模型可以作为其他任何复杂关系模型的基础模型。W3C推荐以RDF标准来解决XML的语义局限。
- 认知智能
人工智能的发展有三个比较重点的阶段:运算智能,感知智能和认知智能。认知智能是人工智能发展的最高形态。认知智能的两个核心是"理解"和"解释",让机器具有"读懂语义、逻辑推理、学习判断"的能力。认知智能旨在赋予机器数据理解、知识表达、逻辑推理、自主学习的能力,使机器能够拥有类似人类的智慧,甚至具备各个行业领域专家的知识积累和运用的能力。认知智能的实现离不开知识图谱技术、自然语言处理技术的支撑。富含实体、概念、属性、关系等复杂信息的知识图谱,是机器认识和理解世界所依赖的知识体系(三观),是认知智能的“大脑”。
- 动态知识图谱
知识图谱的构建
大规模知识库的构建与应用需要多种智能信息处理技术的支持。通过知识抽取技术,可以从一些公开的半结构化、非结构化的数据中提取出实体、关系、属性等知识要素。通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。知识图谱的构建方法有三种: 自底向上、自顶向下和二者混合的方法。
知识抽取
知识抽取涉及到以下几项自然语言处理的技术:
-
实体命名抽取
-
关系抽取
-
实体统一
-
指代消除
-
知识补全
知识融合
知识图谱可以由任何机构和个人自由构建,其背后的数据来源广泛、质量参差不齐,导致它们之间存在多样性和异构性。语义集成的提出就是为了能够将不同的知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图谱的应用程序间的交互建立操作性。常用的技术包括本体匹配(也称为本体映射)、实力匹配(也称为实体对齐、对象公指消解)以及知识融合等。一个语义集成的常见流程,主要包括:输入、预处理、匹配、知识融合和输出5个环节。
存储格式
知识图谱主要有两种存储方式:一种是基于RDF的存储;另一种是基于图数据库的存储。它们之间的区别如下图所示。RDF一个重要的设计原则是数据的易发布以及共享,图数据库则把重点放在了高效的图查询和搜索上。其次,RDF以三元组的方式来存储数据而且不包含属性信息,但图数据库一般以属性图为基本的表示形式,所以实体和关系可以包含属性,这就意味着更容易表达现实的业务场景。
知识图谱的应用
-
不一致性验证
-
异常分析
-
基于规则提取特征
-
基于模式的判断(子图提取)
-
基于概论的社区挖掘、标签传播、聚类
参考文献
-
什么是知识图谱?https://zhuanlan.zhihu.com/p/71128505
-
知识图谱的技术与应用(18版)https://zhuanlan.zhihu.com/p/38056557
-
知识图谱概述 https://zhuanlan.zhihu.com/p/77467615
-
刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(03):582-600.
-
漆桂林,高桓,吴天星.知识图谱研究进展[J].情报工程,2017,3(01):4-25.
-
黄恒琪,于娟,廖晓,席运江.知识图谱研究综述[J].计算机系统应用,2019,28(06):1-12.