知识表示与存储

1 知识表示

知识表示是一种对知识的描述方式,利用信息技术将真实世界中海量信息转化为计算机处理模式的结构化数据。

早期知识表示方法有一阶逻辑、霍恩逻辑、语义网络、产生式规则、框架系统、脚本理论等。随着语义网SW的提出,万维网联盟(W3C)提出了XML、RDF、RDFS和OWL描述语言。XML为最早的语义网描述语言,以文档为单位表示知识,可用于标记数据和定义数据类型;RDF提供一个统一的标准以“主体-谓词-宾语”的SPO三元组来描述实体和资源;RDFS为RDF的拓展,对RDF的类、属性及关系提供了模式定义,为RDF提供了数据模型和简单的约束规则;OWL在RDFS的基础上,针对复杂场景,添加了额外的预定义词来描述资源,如可以声明数据的等价性、属性的传递性、互斥性、函数性、对称性等。这些都是基于符号逻辑的传统知识表示方法,难以挖掘分析知识实体间的语义关系。

 

 

 

 

近年来基于深度学习的知识表示学习在语音识别、图像分析和自然语言处理领域得到广泛关注。其通过将研究对象(三元组)中的语义信息投影到稠密的低维向量空间,实现对实体和关系语义信息的分布式表示,可以高效地计算实体、关系间的复杂语义关系,易于深度学习模型的集成。

2 知识存储

知识存储的目的是确定合理高效的知识图谱存储方式。知识图谱的主要存储方式有三种:RDF数据库、传统关系型数据库存储和图数据库存储。

2.1 RDF数据库

RDF数据库存储是将RDF数据集的三元组抽象为图的形式存储数据。优点有图结构描述直观、语义表达能力强和易于数据共享发布;缺点为设计不灵活、占用存储空间大和查询搜索效率低。目前学术界主要开源的RDF数据库包括:Jena、RDF4J和gStore等。

2.2 关系型数据库

RDB使用三元组、水平表、属性表、垂直划分和六重索引等建表方式存储知识三元组。优点有存储效率高、查询效率高;缺点为关联查询效率低和难以实时查询。目前主流开源的RDB有PostgreSQL和MySQL等。

 

2.3  图数据库

GDB是一种非关系型数据库,以节点和边表示数据,明确列出数据节点间的依赖关系,具有完善的图查询语言且支持各种图挖掘算法。优点有深度查询效率高和多跳查询效率高;缺点为资源消耗大。典型的GDB有Neo4j、JanuaGraph和HugeGraph等。

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值