知识表示与存储

最新推荐文章于 2024-04-26 13:54:35 发布

紫26

最新推荐文章于 2024-04-26 13:54:35 发布

阅读量1.2k

点赞数 1

文章标签：知识图谱人工智能

本文链接：https://blog.csdn.net/yangzai0326/article/details/125113033

版权

1 知识表示

知识表示是一种对知识的描述方式，利用信息技术将真实世界中海量信息转化为计算机处理模式的结构化数据。

早期知识表示方法有一阶逻辑、霍恩逻辑、语义网络、产生式规则、框架系统、脚本理论等。随着语义网SW的提出，万维网联盟（W3C）提出了XML、RDF、RDFS和OWL描述语言。XML为最早的语义网描述语言，以文档为单位表示知识，可用于标记数据和定义数据类型；RDF提供一个统一的标准以“主体-谓词-宾语”的SPO三元组来描述实体和资源；RDFS为RDF的拓展，对RDF的类、属性及关系提供了模式定义，为RDF提供了数据模型和简单的约束规则；OWL在RDFS的基础上，针对复杂场景，添加了额外的预定义词来描述资源，如可以声明数据的等价性、属性的传递性、互斥性、函数性、对称性等。这些都是基于符号逻辑的传统知识表示方法，难以挖掘分析知识实体间的语义关系。

近年来基于深度学习的知识表示学习在语音识别、图像分析和自然语言处理领域得到广泛关注。其通过将研究对象（三元组）中的语义信息投影到稠密的低维向量空间，实现对实体和关系语义信息的分布式表示，可以高效地计算实体、关系间的复杂语义关系，易于深度学习模型的集成。

2 知识存储

知识存储的目的是确定合理高效的知识图谱存储方式。知识图谱的主要存储方式有三种：RDF数据库、传统关系型数据库存储和图数据库存储。

2.1 RDF数据库

RDF数据库存储是将RDF数据集的三元组抽象为图的形式存储数据。优点有图结构描述直观、语义表达能力强和易于数据共享发布；缺点为设计不灵活、占用存储空间大和查询搜索效率低。目前学术界主要开源的RDF数据库包括：Jena、RDF4J和gStore等。

2.2 关系型数据库

RDB使用三元组、水平表、属性表、垂直划分和六重索引等建表方式存储知识三元组。优点有存储效率高、查询效率高；缺点为关联查询效率低和难以实时查询。目前主流开源的RDB有PostgreSQL和MySQL等。

2.3 图数据库

GDB是一种非关系型数据库，以节点和边表示数据，明确列出数据节点间的依赖关系，具有完善的图查询语言且支持各种图挖掘算法。优点有深度查询效率高和多跳查询效率高；缺点为资源消耗大。典型的GDB有Neo4j、JanuaGraph和HugeGraph等。

紫26

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
知识表示与存储

1 知识表示知识表示是一种对知识的描述方式，利用信息技术将真实世界中海量信息转化为计算机处理模式的结构化数据。早期知识表示方法有一阶逻辑、霍恩逻辑、语义网络、产生式规则、框架系统、脚本理论等。随着语义网SW的提出，万维网联盟（W3C）提出了XML、RDF、RDFS和OWL描述语言。XML为最早的语义网描述语言，以文档为单位表示知识，可用于标记数据和定义数据类型；RDF提供一个统一的标准以“主体-谓词-宾语”的SPO三元组来描述实体和资源；RDFS为RDF的拓展，对RDF的类、属性及关系提供了模式定义，为RD
复制链接

扫一扫