一、表示与存储
概述
图论基础
知识图谱的逻辑表示
知识图谱的物理存储
二、知识图谱基本操作
三、知识图谱存储
1.基于云平台的分布式存储
基于Hadoop
基于其它云平台
具有成熟的任务处理模式、数据分布存储方式
SHARD:以三元组为单位,存储在HDFS上
S2DF:spark SQL的接口,将表间的连接接口序列化到关系数据库
Trinity:并行计算系统,大批量计算,异步同步,支持事务
2. 基于数据划分的分布式存储
图划分的定义:
(1)子图与子图的规模差距不大
(2)在负载均衡的条件下使切分代价最小化,即交互边的数量最少
方法分类: