【知识图谱】概念篇

知识图谱相关概念

概述

用图模型来描述知识和建模世间万物之间关联关系的技术方法。由节点和边组成,节点可以是实体或抽象的概念,边可以是实体的属性或实体之间的关系。

知识图谱旨在从数据中识别、发现和推断事物与概念之间的复杂关系,是事务关系的可计算模型。知识图谱构建涉及知识建模、关系抽取、图存储、关系推理、实体融合等多方面技术,应用领域涉猎语义搜索、智能问答、语言理解、决策分析多个领域。

发展历史

专家系统:专家是基于大脑中的知识来进行决策的,通过计算机符号表示这些知识,通过推理机模拟人脑对知识进行处理。早起专家系统常用的知识表示方法包括基于框架的语言产生式规则等。

  • 框架语言:用于描述客观世界的类别、个体、属性及关系等,辅助自然语言理解。
  • 产生式规则:主要用于描述类似 if-then 的逻辑结构,适合于刻画过程性知识。

现代知识图谱的显著特点是规模巨大,无法单一靠人工和专家构建。

知识图谱辅助大数据分析

知识图谱和语义技术被用于辅助进行数据分析和决策。通过基于本体融合和集成多种来源的数据,通过知识图谱和语义技术增强数据之间的关联,使得用户可以更加直接的图谱方式对数据进行关联挖掘与分析。

描述性数据分析指依赖数据本身的语义描述数据分析的方法。不同计算性数据分析主要以建立各种数据分析模型,如深度神经网络,而描述性数据分析突出预先抽取数据的语义,建立数据之间的逻辑,并依靠逻辑推理的方法来实现数据分析。

技术流程

知识图谱用于表达更加规范的高质量数据。一方面,知识图谱采用更加规范标准的概念模型、本体术语和语法格式来建模和描述数据;另一方面,知识图谱通过语义链接增强数据之间的关系。

  • 知识来源方面,语义技术也被用来对传感器产生的数据进行语义化。对物联设备进行抽象,定义符合语义标准的数据接口,对传感数据进行语义封装和对传感数据增加上下文语义描述。

  • 知识表示方面,通过计算机符号描述表示人脑中的知识,以支持机器模拟人的心智进行推理的方法与技术。RDF 把三元组作为基本数据模型,其基本的逻辑结构包括包含主语、谓词、宾语三个部分。本质上都包含实体、实体属性和实体之间关系几个关键要素。

  • 知识抽取,通过大多依靠已有结构化数据资源进行转化,形成基础数据集,再依靠自动化知识抽取和知识图谱不全技术,从多种数据来源进一步扩展知识图谱,并通过人工众包进一步提升知识图谱质量。

  • 知识融合,从第三方知识库产品或已有结构化数据中获取知识输入。

  • 知识图谱的补全与推理

    • 本体推理的补全方法:基于描述逻辑的推理以及相关推理机实现。(主要针对TBox——概念层进行推理,也可以用来对实体级关系进行补全)
    • 基于图结构和关系路径特征的方法:基于随机游走获得路径特征的PRA算法,基于子图结构的SFE算法、基于层次化随机游走模型的PRA算法。以上算法通过两个实体节点之间的路径,及节点周围图结构提取特征,并通过随机游走算法降低特征抽取复杂度,然后叠加线性学习模型进行关系的预测。
    • 基于表示学习和知识图谱嵌入的链接预测,(实现单步的推理),对更为复杂的模型如向量空间引入随机游走模型方法,在同一向量空间中将路径与实体和关系一起表示出来再进行补全的模型。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值