知识图谱(Knowledge Graph)之综述理解

注:该博文是我在看了数篇知识图谱综述以及阅读了相关资料后的一个总结以及自己的相关理解。

知识图谱技术是人工智能技术的重要组成部分,以结构化的方式描述客观世界中的概念、实体及其键的关系。知识图谱提技术提供了一种更好的组织、管理和理解互联网海量信息的能力,将互联网的信息表达成更接近于人类认知世界的形式。因此,建立一个具有语义处理能力与开放互联能力的知识库,可以在智能搜索、智能问答、个性化推荐等智能信息服务重产生应用价值。

知识图谱的研究背景及其意义

单单从字面上理解,知识图谱应该是一种更加结构化(主要是基于图)的知识库,将散乱的知识有效的组织起来,方便人们的查阅,而不是之前那样一堆文在摆在眼前,没有一目了然的赶脚,哈哈哈。所以,很容易想到,知识图谱的产生背景就是,第一方面互联网信息的暴增,以及信息的杂乱无章,第一个意义就是为了人们更加快速有效的检索某一信息。,第二方面,随着现在科学技术的进步与发展,很多先进技术都应运而生(比如深度学习),人们期望机器像人一样可以去理解海量的网络信息,期望可以更快、准确、智能的获取到自己需要的信息,为了满足这种需求,智能化的知识图谱应运而生,其研究意义还是在于方便人类!(有木有发现,几乎所有的研究意义都是这四个字呐)(在这里我只是用一种简单理解的方式来表达,当然还有更多的研究意义,只不过知识图谱刚刚开始火热起来的时候,就是应用在信息检索方面。为了容易理解以及方便记忆,记住这个就ok了)
   一般情况下研究背景就体现了研究意义。以下是官网语言描述,非完美主义者可以跳过这些繁琐的文字表达,哈哈哈。
   伴随着web技术的不断演进与发展,人类先后经历了以文档互联为主要特征的“web 1.0”时代,以数据互联为特征的“web 2.0”时代,正在迈向基于知识互联的崭新“Web 3.0”时代。

知识互联网的目标是构建一个人与机器都可以理解的万维网,使得人们的网络更加智能化。然而,由于万维网上的内容多源一直,组织结构松散,给大数据环境下的知识互联带来了极大的挑战。因此,人们需要根据大数据环境下的知识组织原则,从新的视角去探索既符合网络信息资源发展变化又能适应用户人之需求的知识互联方法,从更深层次上揭示人类认知的整体性关联性。知识图谱以其强大的语义处理能力与开放互联能力,使web 3.0提出的“知识之网”远景成为了可能。
   进入21世纪,随着互联网的蓬勃发展以及知识的爆炸式增长,搜索引擎被广泛使用。传统的搜索引擎技术能够根据用户查询快速排序网页,提高信息检索的效率。然而,这种网页检索效率并不意味这用户能够快速准确的获取信息和知识,对于搜索引擎返回的大量结果还需要进行人工排查和筛选。面对互联网上不断增加的海量信息,网页检索方式(仅包含网页和网页之间链接的传统文档)已经不能满足人们迅速获取所需信息和全面掌握信息资源的需求。为了满足这种需求,知识图谱技术应运而生。它们力求通过将知识进行更加有序、有机的组织起来,使用户可以更加快速、准确地访问自己需要的知识信息,并进行一定的知识挖局和智能决策。从机构知识库到互联网搜索引擎,近年来不少学者和机构纷纷在知识图谱上深入研究,希望以这种更加清晰、动态的方式(注:知识图谱一定是动态的,不断更新的,不是静止的,不然,就是去了其真正的意义)展现各种概念之间的联系,实现知识的智能获取和管理。

知识图谱的发展

20世纪中叶,普莱斯等人提出使用引文网络来研究当代科学发展的脉络的方法,首次提出了知识图谱的概念。(注意:这里的知识图谱和本博文主要介绍的知识图谱不太一样,在此是指Mapping Knowledge Domain,而本博文主要介绍的知识图谱是指Knowledge Graph)1977年,知识工程的概念在第五届国际人工智能大会上被提出,以专家系统为代表的知识库系统开始被广泛研究和应用,直到20世纪90年代,机构知识库的概念被提出,自此关于知识表示、知识组织的研究工作开始深入开展起来。机构知识库系统被广泛应用于各科研机构和单位内部的资料整合以及对外宣传工作。2012年11月Google公司率先提出知识图谱(Knowledge Graph,KG)的概念,表示将在其搜索结果中加入知识图谱的功能。其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。据2015年1月统计的数据,Google 构建的KG已经拥有5亿个实体,约35亿条实体关系信息,已经被广泛应用于提高搜索引擎的搜索质量。虽然知识图谱(Knowledge Graph)的概念较新,但它并非是一个全新的研究领域,早在2006年,Berners Lee就提出了数据链接(linked data)的思想,呼吁推广和完善相关的技术标准如URI(Uniform resource identifier),RDF(resource discription framework),OWL(Web ontology language),为迎接语义网络的到来做好准备。随后掀起了一场语义网络研究的热潮,知识图谱技术正是建立在相关的研究成果之上的,是对现有语义网络技术的一次扬弃和升华。

Created with Raphaël 2.2.0 起源(20世纪中叶):知识图谱(Mapping Knowledge Domain) 发展(20世纪90年代):知识库(Knowledge Base) 形成(2012年Google首次提出):知识图谱(Knowledge Graph)

知识图谱的定义

在维基百科的官方词条中:知识图谱是Google用于增强其搜索引擎功能的知识库。本质上,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。现在的知识图谱已被用来泛指各种大规模的知识库。可作如下定义:


知识图谱 :是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体 关系 实体”三元组,以及实体及其相关属性值对,实体间通过关系相互联结,构成网状的知识结构。


三元组是知识图谱的一种通用表示方式,即 G ∈ ( E , R , S ) G \in (E,R, S) G(E,R,S),其中 E = { e 1 , e 2 , . . . , e ∣ E ∣ } E= \{e_1 ,e_2 ,...,e_{|E|} \} E={ e1,e2,...,eE}是知识库中的实体集合,共包含| E |种不同实体; R = { r 1 , r 2 , . . . , r ∣ R ∣ } R= \{r_1 ,r_2 ,...,r_{|R|} \} R={ r1,r2,...,rR}是知识库中的关系集合,共包含| R |种不同关系; S ⊆ E × R × E S \subseteq E \times R\times E SE×R×E 代表知识库中的三元组集合。三元组的基本形式主要包括实体1、关系、实体2和概念、属性、属性值等,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等;属性主要指对象可能具有的属性、特征、特性、特点以及参数,例如国籍、生日等;属性值主要指对象指定属性的值,例如中国、1988-09-08等。每个实体(概念的外延)可用一个全局唯一确定的ID来标识,每个属性-属性值对(attribute-value pair,AVP)可用来刻画实体的内在特性,而关系可用来连接两个实体,刻画它们之间的关联。

在此,知识图谱包含三层含义:

  • 知识图谱本身是一个具有属性的实体通过关系链接而成的网状知识库.从图的角度来看,知识图谱在本质上是一种概念网络,其中的节点表示物理世界的实体(或概念),而实体间的各种语义关系则构成网络中的边.由此,知识图谱是对物理世界的一种符号表达 .
  • 知识图谱的研究价值在于,它是构建在当前Web基础之上的一层覆盖网络(overlay network),借助知识图谱,能够在Web网页之上建立概念间的链接关系,从而以最小的代价将互联网中积累的信息组织起来,成为可以被利用的知识。
  • 知识图谱的应用价值在于,它能够改变现有的信息检索方式,一方面通过推理实现概念检索(相对于现有的字符串模糊匹配方式而言);另一方面以图形化方式向用户展示经过分类整理的结构化知识,从而使人们从人工过滤网页寻找答案的模式中解脱出来。

#知识图谱的架构

在此主要给出几个常见的知识图谱架构图,这几个图大同小异,通过看图可以一目了然的理解,免去了文字的繁琐介绍。

在这里插入图片描述
在这里插入图片得到描述
在这里插入图片描述

知识图谱架构主要部分:
- 知识抽取(包括实体抽取、关系抽取以及属性抽取等)
- 知识融合(包括实体消岐等)
- 知识加工(包括本体构架、知识推理等)
- 知识更新

大规模知识库

  • 66
    点赞
  • 309
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论
常识性知识图谱是一种以图谱结构来组织和表示常识性知识的技术。它以实体、属性和关系为基本元素,将各种类型的常识性知识以节点和边的形式连接起来,形成一个丰富的知识网络。 在常识性知识图谱中,实体代表现实世界中的事物,如人物、地点、组织、概念等。属性表示实体的性质或特征,如人物的出生日期、地点的经纬度等。而关系则描述实体之间的关联或联系,如人物之间的亲属关系、地点之间的距离关系等。 常识性知识图谱的建立主要依靠自然语言处理、信息抽取和知识表示等技术。首先,通过自然语言处理技术,从多种文本资源中抽取出实体、属性和关系的信息。然后,利用信息抽取技术将这些信息结构化,并按照图谱的形式进行组织。最后,通过知识表示技术,将这些结构化的知识表示为计算机可理解的形式,以便机器能够基于知识图谱进行推理和理解。 常识性知识图谱具有广泛的应用前景。它可以用于智能问答系统,提供准确、全面的答案;用于智能推荐系统,根据用户的兴趣和需求,为其推荐个性化的内容;用于智能机器人,帮助机器人具备理解和推理能力,提供更智能的服务等等。 然而,常识性知识图谱的构建面临一些挑战,如知识获取的可靠性和准确性,知识表示的一致性和丰富性等。未来,通过不断改进知识抽取、知识推理等技术,常识性知识图谱有望更好地支持人工智能系统的发展,为人们提供更智能、更高效的服务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱科研的徐博士

请各位看官赏赐,小仙女笔芯笔芯

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值