解决问题
主要解决复杂关系网络数据存储,支持高并发,低延迟,高可用的读写能力
架构
详细架构
存储格式
vertisces: 顶点
edges: 边
in-edge: 入边 out-edge:出边 数据冗余,为了增加性能
micro shards: micro-sharding性能评测 | MongoDB中文社区 一台机器有多大shard
底层结构
全量更新
主要通过文件存储系统+MapReduce,提高效率。
批量更新
业务基于odps表生成tag表,告诉geabase哪些数据是更新,哪些是删除,然后geabase生成多个odps分表,然后回流到对应的geabase表
实时更新
通过消息队列,进行数据同步写入
案例
找到F和FOFOF的交集
从里往外看,
首先
NAV :Start = AccId :Edge_Type = 'associated' 查询个人账号
然后
查询关系分大于80的好友
个性化推荐