知识图谱04:知识图谱的存储与检索

本文探讨了知识图谱的存储方法,包括关系型数据库的三元组表、水平存储、属性表和垂直分割,以及图数据库的存储优势。关系型数据库适用于固定数据,而图数据库则擅长处理复杂关系查询。同时,非关系型数据库如MongoDB也能提供灵活的存储方案。知识图谱的存储选择应根据后续使用的效率来确定,通常会结合多种方式以优化存储和查询性能。
摘要由CSDN通过智能技术生成
公众号:数据挖掘与机器学习笔记

Web本体语言OWL是当前存储本体的主要形式.OWL也适用于知识图谱的存储, 但OWL文档不适用于大数据量的情况, 影响查询、修改和推理速度. 作为知识库的知识图谱, 其基本元素是海量的各种关系联系在一起的实体, 需要创新性的存储方式. 知识图谱可采用关系型数据库或图数据库存储, 也可采用混合的方式存储。

1.关系型数据库

将知识图谱存入关系型数据库, 是一个将知识图谱转换为RDF三元组进行存储的问题, 即, 将知识图谱的关系分解为一个个<Subject, Predicate, Object>的三元组形式, 并映射至关系表, 存储于关系型数据库中.根据映射方法不同, 基于关系型数据库的知识图谱存储可以采用四种方法:

  • 三元组表

    构建一张只有三列的表(Subject,Predicate, Object), 以元组为单位进行存储, 将知识图谱所有的RDF三元组都存放在这个表中. 这一方法简单直观, 有很好的通用性, 且语义表达较为明确. 但在涉及关系的查询过程中可能会面临大量的自连接操作,导致查询性能低下.

  • 水平存储

    将知识图谱中的每个实体表示为数据库表中的一行, 表中的列包括有RDF数据集合中所有的属性. 水平存储的优势在于设计简单, 能够高效查询面向某单个实体的属性值. 而其缺点在于:

    ①数据稀疏性, 一个实体并不可能在所有的属性上都有属性值, 从而导致表中的大量空值, 增加存储负载也影响查询效率.

    ②水平存储中表的列数量是固定的, 这样的固定模式使得实体在一个属性上只能存储一个值. 但在实际应用中, 属性往往都会存在多个值而与水平存储的模式不符.

    ③固定的模式也会令数据的变化带来较大的更新成本. 数据属性的更新可能涉及到整个表结构的变化, 这也使水平存储无法很好应对这类问题.

  • 属性表

    属性表针对水平存储模式中表的数据稀疏

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值