目录
JanusGraph介绍
JanusGraph 是一个开源的、分布式的、基于属性图的数据库,由 Apache TinkerPop 社区开发。它支持 Apache Cassandra 和 Apache HBase 作为存储后端,并提供原生支持 Gremlin 图遍历语言。
JanusGraph 的主要优势
- 支持非常大的图。JanusGraph 图可以随着集群中机器的数量而扩展。
- 支持非常多的并发事务和操作性图处理。JanusGraph 的事务容量随着集群中机器的数量而扩展,并能够在毫秒内回答复杂的遍历查询。
- 支持全球图分析和批量图处理通过 Hadoop 框架。
- 支持地理、数值范围和全文搜索对于非常大的图中的顶点和边。
- 原生支持 Apache TinkerPop 提供的流行的属性图数据模型。
- 原生支持 Gremlin 图遍历语言。
- 众多图级别配置可用于调整性能。
- 顶点中心索引提供顶点级查询,以缓解臭名昭著的超节点问题。
- 提供优化的磁盘表示,以允许有效地使用存储和访问速度。
JanusGraph 的应用
- 社交网络
- 推荐系统
- 知识图谱
- 机器学习
- 数据挖掘
JanusGraph 的行业应用
- 腾讯使用 JanusGraph 来构建其社交网络图谱。
- 微软使用 JanusGraph 来构建其推荐系统。
- 美国国家航空航天局 (NASA) 使用 JanusGraph 来构建其知识图谱。
- 谷歌使用 JanusGraph 来进行机器学习和数据挖掘。
参考文档:JanusGraph
架构概览
JanusGraph 架构可以利用分布式技术和横向扩展能力实现高性能的图数据库操作。它专注于紧凑的图序列化、丰富的图数据建模和高效的查询执行。JanusGraph可以利用Spark进行图分析和批处理图处理构建。JanusGraph实现了强大、模块化的接口,用于数据持久化、数据索引和客户端访问。JanusGraph的模块化架构使其能够与各种存储、索引和客户端技术进行交互;它还简化了扩展JanusGraph以支持新技术的过程。