知识图谱(Knowledge Graph)之综述理解

最新推荐文章于 2024-08-19 16:43:37 发布

爱科研的徐博士

最新推荐文章于 2024-08-19 16:43:37 发布

阅读量7.1w

点赞数 66

分类专栏：【算法】知识图谱【算法】自然语言文章标签：知识图谱综述知识图谱关键技术

本文链接：https://blog.csdn.net/u010626937/article/details/88106081

版权

知识图谱作为AI的重要组成部分，通过结构化描述客观世界，提升信息检索和理解。从研究背景、定义、发展到关键技术，如知识抽取、融合、表示等，知识图谱在搜索引擎、智能问答等领域展现巨大价值。尽管面临实体消歧、关系表示等挑战，知识图谱在多领域应用中持续发展，成为智能服务的关键。

摘要由CSDN通过智能技术生成

注：该博文是我在看了数篇知识图谱综述以及阅读了相关资料后的一个总结以及自己的相关理解。

知识图谱技术是人工智能技术的重要组成部分，以结构化的方式描述客观世界中的概念、实体及其键的关系。知识图谱提技术提供了一种更好的组织、管理和理解互联网海量信息的能力，将互联网的信息表达成更接近于人类认知世界的形式。因此，建立一个具有语义处理能力与开放互联能力的知识库，可以在智能搜索、智能问答、个性化推荐等智能信息服务重产生应用价值。

知识图谱的研究背景及其意义

单单从字面上理解，知识图谱应该是一种更加结构化（主要是基于图）的知识库，将散乱的知识有效的组织起来，方便人们的查阅，而不是之前那样一堆文在摆在眼前，没有一目了然的赶脚,哈哈哈。所以，很容易想到，知识图谱的产生背景就是，第一方面互联网信息的暴增，以及信息的杂乱无章，第一个意义就是为了人们更加快速有效的检索某一信息。，第二方面，随着现在科学技术的进步与发展，很多先进技术都应运而生（比如深度学习），人们期望机器像人一样可以去理解海量的网络信息，期望可以更快、准确、智能的获取到自己需要的信息，为了满足这种需求，智能化的知识图谱应运而生，其研究意义还是在于方便人类！(有木有发现，几乎所有的研究意义都是这四个字呐_{)（在这里我只是用一种简单理解的方式来表达，当然还有更多的研究意义，只不过知识图谱刚刚开始火热起来的时候，就是应用在信息检索方面。为了容易理解以及方便记忆，记住这个就ok了})
　　　一般情况下研究背景就体现了研究意义。以下是官网语言描述，非完美主义者可以跳过这些繁琐的文字表达，哈哈哈。
　　　伴随着web技术的不断演进与发展，人类先后经历了以文档互联为主要特征的“web 1.0”时代，以数据互联为特征的“web 2.0”时代，正在迈向基于知识互联的崭新“Web 3.0”时代。

知识互联网的目标是构建一个人与机器都可以理解的万维网,使得人们的网络更加智能化。然而，由于万维网上的内容多源一直，组织结构松散，给大数据环境下的知识互联带来了极大的挑战。因此，人们需要根据大数据环境下的知识组织原则，从新的视角去探索既符合网络信息资源发展变化又能适应用户人之需求的知识互联方法，从更深层次上揭示人类认知的整体性关联性。知识图谱以其强大的语义处理能力与开放互联能力,使web 3.0提出的“知识之网”远景成为了可能。
　　　进入21世纪，随着互联网的蓬勃发展以及知识的爆炸式增长，搜索引擎被广泛使用。传统的搜索引擎技术能够根据用户查询快速排序网页，提高信息检索的效率。然而，这种网页检索效率并不意味这用户能够快速准确的获取信息和知识，对于搜索引擎返回的大量结果还需要进行人工排查和筛选。面对互联网上不断增加的海量信息，网页检索方式（仅包含网页和网页之间链接的传统文档）已经不能满足人们迅速获取所需信息和全面掌握信息资源的需求。为了满足这种需求，知识图谱技术应运而生。它们力求通过将知识进行更加有序、有机的组织起来，使用户可以更加快速、准确地访问自己需要的知识信息，并进行一定的知识挖局和智能决策。从机构知识库到互联网搜索引擎，近年来不少学者和机构纷纷在知识图谱上深入研究，希望以这种更加清晰、动态的方式（注：知识图谱一定是动态的，不断更新的，不是静止的，不然，就是去了其真正的意义）展现各种概念之间的联系，实现知识的智能获取和管理。

知识图谱的发展

20世纪中叶，普莱斯等人提出使用引文网络来研究当代科学发展的脉络的方法，首次提出了知识图谱的概念。（注意：这里的知识图谱和本博文主要介绍的知识图谱不太一样，在此是指Mapping Knowledge Domain，而本博文主要介绍的知识图谱是指Knowledge Graph）1977年，知识工程的概念在第五届国际人工智能大会上被提出，以专家系统为代表的知识库系统开始被广泛研究和应用，直到20世纪90年代，机构知识库的概念被提出，自此关于知识表示、知识组织的研究工作开始深入开展起来。机构知识库系统被广泛应用于各科研机构和单位内部的资料整合以及对外宣传工作。2012年11月Google公司率先提出知识图谱（Knowledge Graph，KG）的概念，表示将在其搜索结果中加入知识图谱的功能。其初衷是为了提高搜索引擎的能力，增强用户的搜索质量以及搜索体验。据2015年1月统计的数据，Google 构建的KG已经拥有5亿个实体，约35亿条实体关系信息，已经被广泛应用于提高搜索引擎的搜索质量。虽然知识图谱（Knowledge Graph）的概念较新，但它并非是一个全新的研究领域，早在2006年，Berners Lee就提出了数据链接（linked data）的思想，呼吁推广和完善相关的技术标准如URI(Uniform resource identifier)，RDF(resource discription framework),OWL（Web ontology language），为迎接语义网络的到来做好准备。随后掀起了一场语义网络研究的热潮，知识图谱技术正是建立在相关的研究成果之上的，是对现有语义网络技术的一次扬弃和升华。

知识图谱的定义

在维基百科的官方词条中：知识图谱是Google用于增强其搜索引擎功能的知识库。本质上，知识图谱是一种揭示实体之间关系的语义网络，可以对现实世界的事物及其相互关系进行形式化地描述。现在的知识图谱已被用来泛指各种大规模的知识库。可作如下定义：

知识图谱：是结构化的语义知识库，用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体关系实体”三元组，以及实体及其相关属性值对，实体间通过关系相互联结，构成网状的知识结构。

三元组是知识图谱的一种通用表示方式，即 $\in (E,R, S)$ ，其中 $E= \{e_1 ,e_2 ,...,e_{|E|} \}$ 是知识库中的实体集合，共包含| E |种不同实体； $R= \{r_1 ,r_2 ,...,r_{|R|} \}$ 是知识库中的关系集合，共包含| R |种不同关系； $\subseteq E \times R\times E$ 代表知识库中的三元组集合。三元组的基本形式主要包括实体1、关系、实体2和概念、属性、属性值等，实体是知识图谱中的最基本元素，不同的实体间存在不同的关系。概念主要指集合、类别、对象类型、事物的种类，例如人物、地理等；属性主要指对象可能具有的属性、特征、特性、特点以及参数，例如国籍、生日等；属性值主要指对象指定属性的值，例如中国、1988-09-08等。每个实体(概念的外延)可用一个全局唯一确定的ID来标识，每个属性-属性值对(attribute-value pair，AVP)可用来刻画实体的内在特性，而关系可用来连接两个实体，刻画它们之间的关联。

在此，知识图谱包含三层含义：

知识图谱本身是一个具有属性的实体通过关系链接而成的网状知识库．从图的角度来看，知识图谱在本质上是一种概念网络，其中的节点表示物理世界的实体（或概念），而实体间的各种语义关系则构成网络中的边．由此，知识图谱是对物理世界的一种符号表达 .
知识图谱的研究价值在于，它是构建在当前Ｗeb基础之上的一层覆盖网络（overlay network），借助知识图谱，能够在Ｗｅｂ网页之上建立概念间的链接关系，从而以最小的代价将互联网中积累的信息组织起来，成为可以被利用的知识。
知识图谱的应用价值在于，它能够改变现有的信息检索方式，一方面通过推理实现概念检索（相对于现有的字符串模糊匹配方式而言）；另一方面以图形化方式向用户展示经过分类整理的结构化知识，从而使人们从人工过滤网页寻找答案的模式中解脱出来。

#知识图谱的架构

在此主要给出几个常见的知识图谱架构图，这几个图大同小异，通过看图可以一目了然的理解，免去了文字的繁琐介绍。

在这里插入图片描述
在这里插入图片得到描述

知识图谱架构主要部分：
- 知识抽取（包括实体抽取、关系抽取以及属性抽取等）
- 知识融合（包括实体消岐等）
- 知识加工（包括本体构架、知识推理等）
- 知识更新

大规模知识库

最低0.47元/天解锁文章

爱科研的徐博士

关注

66
点赞
踩
311

收藏

觉得还不错? 一键收藏
打赏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录