图数据库JanusGraph入门(一)JanusGraph初识

2401_84002482

于 2024-05-02 19:26:10 发布

阅读量614

点赞数 26

分类专栏：程序员文章标签：数据库

本文链接：https://blog.csdn.net/2401_84002482/article/details/138398100

版权

程序员专栏收录该内容

195 篇文章 1 订阅

订阅专栏

本文介绍了图数据库的概念，其在处理复杂数据结构中的优势，重点阐述了JanusGraph作为图数据库引擎的特点，以及在金融反欺诈等领域的应用。同时提到了JanusGraph的历史和发展，以及其与其他技术的集成可能性。

摘要由CSDN通过智能技术生成

图数据库是什么？

💬图数据库就是用来存储图结构的数据库。图数据库也是属于NoSQL一种。

-NoSQL数据库大致可以分为以下几类：

键值对(key-value)数据库(遵循“键——值”模型，是最简单的数据库管理系统)：如Memcache、Redis、Berkeley DB、SQLite…
列簇式数据库（按照列（由“键——值”对组成的列表）在数据文件中记录数据，以获得更好的请求及遍历效率。一行中的列数允许动态变化，且列的数目可达数百万，每条记录的关键码不同，支持多值列。）：如HBase、hive、sybase IQ/SAPIQ、GreenPlum…
文档型数据库(无固定结构，不同的记录允许有不同的列数和列类型。列允许包含多值，记录允许嵌套)：如Mongodb、Couchbase、Amazon DynamoDB、CouchDB、MarkLogic…
图数据库（以“点——边”组成的网络（图结构）来存储数据）：如Neo4j、JanusGraph、OrientDB、Titan、Virtuoso、ArangoDB …
搜索引擎（存储的目的是为了搜索，主要功能是搜索）：如Elasticsearch、Solr、Splunk、MarkLogic、Sphinx…
对象数据库（受面向对象编程语言的启发，把数据定义为对象并存储在数据库中，包括对象之问的关系，如继承）：如Caché、db4o、Versant Object Database、ObjcctStore、Matisse …
时序数据库（存储时间序列数据，每条记录都带有时间戳。如存储从感应器采集到的数据）：如InfluxDB、RRDtool、Graphite、OpcnTSDB、Kdb+ …

图数据库的作用？

💬图数据库主要处理的是拓扑关系的图，善于处理大量、复杂、互联、多变的网状海量数据，其效率远远高于传统的关系型数据库。就比如下面的图：

在这里插入图片描述

图数据库应用背景

💬图数据库所提供的关联分析能力是金融反欺诈、威胁情报、黑产打击和案件溯源等业务所需要的核心能力。图数据库的需求非常多，例如金融安全业务希望使用图数据库进行金融反欺诈关联分析、威胁情报业务希望通过图数据库进行黑产研究和情报分析、还有社交关系分析、知识图谱等需求场景。

二、JanusGraph简介

JanusGraph简介

💬JanusGraph是一个图形数据库引擎。其本身专注于紧凑图序列化、丰富图数据建模、高效的查询执行。另外，JanusGraph利用Hadoop进行图分析和批处理图处理。JanusGraph为数据持久性、数据索引、客户端访问实现了强大的模块化接口。JanusGraph的模块化体系结构使其可以与多种存储、索引、客户端技术进行互操作。它还简化了扩展JanusGraph以支持新的过程。

JanusGraph可以适配多种数据库和索引。JanusGraph默认支持以下的适配，但是JanusGraph的模块化架构使得也支持第三方的适配器。

数据库：

Apache Cassandra
Apache HBase
Oracle Berkeley DB Java版

索引：

Elasticsearch
Apache Solr
Apache Lucene

JanusGraph的发展历史

💬JanusGraph是2016年12月27日从Titan fork出来的一个分支，之后TiTan的开发团队在2017年陆续发了0.1.0rc1、0.1.0rc2、0.1.1、0.2.0等四个版本，最新的版本是2017年10月12日。 titan是从2012年开始开发，到2016年停止维护的一个分布式图数据库。最初在2012年启动titan项目的公司是Aurelius，2015年此公司被 DataStax（DataStax是开发apache Cassandra 的公司）收购，DataStax公司吸收了TiTan的图存储能力，形成了自己的商业产品DataStax Enterprise Graph。

TiTan开发者们希望把TitTan放到Apache Software Foundation下，不过，DataStax不愿意这样做（可能考虑到要保护自己的商业产品DataStax Enterprise Graph的技术优势吧，其实这点优势是从Titan来的），而且自从2015年9月DataStax收购了Titan的母公司后，TiTan一直处于停滞状态（应该是DataStax收购之后，忙于推出自己的商业产品DataStax Enterprise Graph，忙于整合Titan进自己的商业产品吧，可是Titan本身没有得到发展）。鉴于此，2016年6月，TiTan的开发者们fork了一个TiTan的分支（因为Titan已经属于DataStax了，所以他们必须另外弄一个商标），重命名为JanusGraph，并将其置于Linux Software Foundation下。

2017年4月6日发布了第一个版本0.1.0-rc1，目前最新版本是2017年10月12日发布的0.2.0版。

JanusGraph项目启动的初衷是“通过为其增加新功能、改善性能和扩展性、增加后端存储系统来增强分布式图系统的功能，从而振兴分布式图系统的开发”，JanusGraph从Apahce TinkerPop中吸收了对属性图模型（Property Graph Model）的支持和对属性图模型进行遍历的Gremlin遍历语言。(“reinvigorate development of the distributed graph system to add new functionality, improve performance and scalability, and maintain a variety of storage backends，JanusGraph incorporates support for the property graph model with the open source graph computing framework Apache TinkerPop and its Gremlin graph traversal language”.）