知识图谱概念

知识是什么?

知识图谱(Knowledge Graph)正如其名,其本质是为了表示知识。那么知识是该如何定义呢?我们来看一下维基百科中的定义:
知识是对某个主题确信的认识,并且这些认识拥有潜在的能力为特定目的而使用。意指透过经验或联想,而能够熟悉进而了解某件事情;这种事实或状态就称为知识,其包括认识或了解某种科学、艺术或技巧。此外,亦指透过研究、调查、观察或经验而获得的一整套知识或一系列资讯。
可以从这块相对抽象的定义里得到一个主观的感受,那就是知识是一种认知,其既是一种事实,也是一种状态。比如,“我会加减乘除”是一种事实也是在表述我通过学习和实践,使得现在已经掌握这项技能的一种状态。并且这种认知是相对复杂的,有从时间变化的纵向维度,也有涉及到关系、概念、实践等等横向维度的变化。但不变的是,知识是有一个主题的,以及由主题衍生出来的各个“属性”组成,类似于树状结构,这一棵树,就是一条知识。
如果用官方一点的定义呢,每条知识是表示为一个 SPO 三元组,即 Subject(主体)Predicate(谓语)Object(客体)
那个回到“表示知识”这个关键点,我们创造出知识图谱这个概念,就是为了帮助我们更快、更好地用来表示出多条独立的“知识”。更进一步说,知识图谱就是用来组织和描述 SPO 三元组的。

如何描述三元组?

前面我们介绍了知识的概念和SPO三元组,我们已经知道了,知识图谱是一条条知识组成的,一条条知识又是三元关系(Subject——Predicate——>Object)组成的,那么问题就来了,如何描述这个三元关系呢?

使用RDF来表示

在知识图谱中,我们用RDF形式化地表示这种三元关系。从定义上来看,RDF(Resource Description Framework),即资源描述框架,是W3C制定的,用于描述实体/资源的标准数据模型。为什么我们描述知识要用“Web”的形式去描述呢?因为网络、Web中的各项关系,其实和知识的抽象概念很像,这是一种即像树,又像网的东西。
有唯一确定主体、有连接属性的谓语、有明确属性值。
那么RDF框架下,对三元组是如何具体定义的呢?我们先来了解一下RDF图中定义的三种类型:International Resource Identifiers(IRIs),blank nodes 和 literals。RDF通过定义出来的这三种属性对SPO三元组进行约束:

  • Subject可以是IRI或blank node。
  • Predicate是IRI。
  • Object三种类型都可以。

可以看到,主体必须是能唯一表示的,或者干脆就是匿名资源(Blank Node,这个概念可以向外引申,在这里可以先忽略)。唯一表示就会用到IRI,相当于是URL和URI的推广[1],用于唯一定义一个实体或是资源。(说白了,就是我们要通过一个确定的方式来找到唯一的它)
谓语也是要唯一表示的,就像你都不知道要和另一个人建立什么关系,你又怎么能跑过去说我们在一起吧。这个“在一起的两个人“这个关系描述得就太模糊,不能唯一确定。举个例子,两个男的可以是朋友、可以是仇人也可以是情侣。
那我们整理一下RDF定义三种类型的用处:

  • IRI —— 在整个网络或者图中唯一定义了一个实体/资源
  • blank node —— 没有IRI和literal的资源,或者说匿名资源[1],暂不详细分析
  • literal —— 字面量,可以看作是带有数据类型的纯文本
    回到刚刚那个例子,架设有两个男人一个为A,一个为B,我们的主体Subject是男人A,我们给他一个IRI:www.man-a/relation;我们的谓语是表示与主体是朋友的关系,我们给他一个带有prefix的IRI:kg:firiends;然后我们的客体就是男人B的名字,我们给他一个字面量:man-b。
    那么这个描述两个男人间朋友关系的这个知识就可以表述为:www.man-a/relation ——kg:firiends——man-b。
    这就是RDF的作用,使用标准数据模型的方式来进行资源描述。

使用属性图来表示

介绍完RDF来表示关系,是不是感觉略有一点复杂,确实,这种方式比较严谨,更贴近知识图谱原始的定义。但实际在工业界应用过程中,还是会有相当多的场景会选择用属性图(Property Graph)的形式来描述“关系”。那么下面我们来介绍一下属性图的方式。
属性图(Property Graph)的逻辑其实特别好理解,就是主体会和很多客体有关系,比如主体是一个普通人A的话,他会有手机号、会有性别、会有家人,这些就是他的客体。而他和他的手机号之间,就是“拥有”的关系、他和他的父亲,就是父子关系,这种关系就是主体和客体的关系。以上三种,主体、关系、客体,都可以有相应的属性。例如普通人A,属性可以是他的名字(也可以成为一种主客体关系);他和他的手机号之间是拥有的关系,“拥有”关系可以有属性“何时拥有”、”如何拥有“等;手机号也可以有属性,比如归属的运营商名字等等。
这种同样描述主客体关系,但支持实体或关系拥有属性的方式,就称为属性图表示。

从知识到知识图谱

我们从知识的定义讲到了如何表示使用RDF定义单条知识,那么知识图谱的具体形象就呼之欲出了,知识图谱就是有多条知识组成的树状或网状结构,总体来说是图的结构。
主体必须唯一确定,谓语需要清楚描述,客体可以是另一条“子知识“也可以是字面量(也就是带数据类型的纯文本)。
以下是一个使用RDF描述的知识图谱,可以看到其通过RDF标准来表示出了单条的知识以及总体的关系:
在这里插入图片描述

以下是一个由属性图来表示的知识图谱,注意其支持实体或关系拥有属性,而RDF形式的就不支持:
在这里插入图片描述

其实更严谨地说,这两种不同的描述关系的方式,其实也是代表了两种知识图谱的存储方式:

  • 基于RDF存储的形式
    • 存储三元组(Triple)
    • 标准的推理引擎
    • W3C标准
    • 易于发布数据
    • 多数为学术界场景
  • 基于图数据库的存储
    • 节点和关系可以带有属性
    • 没有标准的推理引擎
    • 图的遍历效率高
    • 事务管理
    • 基本为工业界场景

知识图谱的作用

知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。 不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。
从这个概念上来说,知识图谱主要解决的问题是一个复杂关联信息的查询和表示。那么我们来看看它的应用需求应该是如何的,换句话说,就是什么样的情况下,我们可以考虑采用知识图谱:

简单方式处理

  • 对可视化需求不高
  • 很少涉及到关系的深度搜索
  • 关系查询效率要求不高
  • 数据缺乏多样性
  • 暂时没有人力或者成本不够

选择知识图谱

  • 有强烈的可视化需求
  • 经常涉及到关系的深度搜索
  • 对关系查询效率有实时性要求
  • 数据多样化、解决数据孤岛问题
  • 有能力、有成本搭建系统
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 知识图谱是一种构建、组织和表示知识的方法和技术,它通过将实体、属性和关系等元素结构化地表示,并将它们以图的形式进行展示,从而构建了一个全面而有组织性的知识网络。 在知识图谱中,实体是指描述世界中具体事物的元素,属性是实体的特征或性质,关系是实体之间相互关联的联系。知识图谱通过将这些元素进行结构化建模,可以实现对知识的共享、搜索和推理等功能。 知识图谱的构建过程包括以下几个步骤:首先,从不同的数据源中采集数据,例如文本、数据库、网页等;然后,对采集到的数据进行处理和分析,提取其中的实体、属性和关系等信息;接下来,将提取到的信息进行建模,构建实体、属性和关系的图结构;最后,对构建好的知识图谱进行优化和扩充。 知识图谱的技术包括:实体链接,即将文本中的实体转化为知识图谱中的实体;关系抽取,即从文本中提取实体之间的关系;知识推理,即通过对知识图谱进行逻辑推理,发现隐藏的知识和规律;图数据库,即用于存储和查询知识图谱的数据库;问答系统,即根据知识图谱中的知识,回答用户的问题等。 知识图谱可以应用于多个领域,例如自然语言处理、智能搜索、智能推荐等。它可以帮助机器理解和处理人类产生的大量知识和信息,提高机器的智能水平,为人们提供更加便捷和准确的信息服务。同时,知识图谱的发展也面临着一些挑战,例如知识表示的表达能力、知识的获取和更新等问题。 ### 回答2: 知识图谱是一种结构化的数据模型,用于表示和存储世界上的知识和事实。它是一个图形数据库,其中节点表示实体或概念,边表示实体或概念之间的关系。知识图谱的目标是捕捉和组织人类知识,并帮助机器理解和推理。 知识图谱技术主要包括实体抽取、关系抽取、实体链接和知识表示等。实体抽取是从文本中识别出命名实体,如人物、地点、组织机构等;关系抽取是从句子或文档中提取出实体之间的关系;实体链接是将文本中的实体链接到知识图谱中的实体对象;知识表示是将知识以可计算的形式表示,如采用RDF(资源描述框架)等语义表示。 知识图谱能够应用于各个领域,如智能搜索、问答系统、推荐系统等。在智能搜索中,知识图谱可以帮助搜索引擎更好地理解用户的查询意图,提供更精准的搜索结果。在问答系统中,知识图谱可以帮助系统理解问题并生成准确的答案。在推荐系统中,知识图谱可以帮助系统挖掘用户的兴趣和偏好,提供个性化的推荐。 有许多应用知识图谱的典型例子,如谷歌的知识图谱、百度的知心、IBM的沃森等。这些知识图谱中包含了大量的结构化知识,可以为用户提供丰富的信息和服务。 总之,知识图谱是一种用于存储和表示知识的数据模型,通过实体抽取、关系抽取、实体链接和知识表示等技术,能够帮助机器理解和推理。它在智能搜索、问答系统、推荐系统等领域有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值