知识图谱的各种存储方式
知识图谱的存储需要综合考虑知识结构、图的特点、索引和查询优化等问题。
典型的知识图谱存储引擎分为基于关系数据库的存储和基于原生图的存储。
图数据库存储并非必须,例如Wikidata项目后端是Mysql实现的。
存储考虑的三个方面问题:
存储的物理结构
存储的性能问题
图的查询问题
图上的查询语言:SPARQL
最简单的存储:Triple Store
Property Tables:属性表存储
基于传统关系数据库实现。
Binary Tables:二元表
二元表也称为垂直划分表。基于关系数据库实现的。
全索引结构:Exhaustive Indexing
性能最好的存储方式是基于全索引结构的存储,典型的包括RDF-3X,Hexastore等。