图数据库Neo4j的调研

最新推荐文章于 2024-09-13 21:40:38 发布

_晓夏_

最新推荐文章于 2024-09-13 21:40:38 发布

阅读量1.3k

点赞数 29

文章标签：数据库 neo4j 图数据库 java

本文链接：https://blog.csdn.net/xzb5566/article/details/141063842

版权

图数据库Neo4j的调研

一、neo4j基础概述

概述

neo4j作为当下最热门的图数据库之一，他的底层实现是java语言，所以安装的时候必须有jre环境。并且neo4j是根据计算机中图论理论来实现的。

neo4j图数据库主要有以下组成元素：（具体介绍可以参考下图）

节点
属性
关系
标签

2. 安装

这是官方下载地址 Neo4j Download Center - Neo4j Graph Data Platform ，这个是社区版的。

neo4j安装包有三种类型，企业版，社区版，桌面版。

建议安装社区版，下载后解压，配置环境变量就可以使用了。

目前最新的neo4j版本是5.5.0的版本。但是这个最新的版本要求 win10的操作系统，由于我本机的是win7的系统，所以我安装的是 4.4.18的版本。

另外neo4j和其他的软件一样，也是可以集群部署（Cluster ），或者单机部署（Standalone）。我们这里就简单进行单机部署

二、官方样例demo

安装好后，我在本机作为window service进程在后台直接启动。neo4j的安装包中有对应的windows环境的 bat脚本，执行就可以了。

本地连接neo4j数据库，导入官方提供的数据，就能看到官方的数据样例了（演员- 电影的关系）。如下图：

官方提供的势示例数据，也就是neo4j的数据库执行脚本

官方示例数据呈现的数据模型

三、实战数据demo

这一节主要讲：

1.java 语言如何读取neo4j的数据

参考这两篇官方说明文档

Get started - Neo4j Java Driver Manual （这是neo4j的官方文档，通过驱动程序，手动连接neo4j数据库访问数据，关闭连接方式）

Spring Data Neo4j（这是spring官方文档，spring框架集成neo4j数据库，这里其实可以通过spring-data来操作neo4j，也可以是spring boot starter方式来操作neo4j）

2. excel数据导入到neo4j数据库

-- 数据导入 cql语句：

LOAD CSV WITH HEADERS FROM 'file:///tree_data/tree_data.csv' AS data CREATE (:Org{name:data.name1,orderIndex:data.index})
CREATE (:Org{name:data.name2})
CREATE (:Org{name:data.name3})
CREATE (:Org{name:data.name4})
CREATE (:Org{name:data.name5})
CREATE (:Org{name:data.name6})
CREATE (:Org{name:data.name7})
MATCH (p:Org) where p.name is null detach delete p
MATCH (entity1:Org{name:data.name2}) , (entity2:Org{name:data.name3})
with entity1,entity2
CREATE (entity1)-[:rel]->(entity2)
MATCH (entity1:Org{name:data.name3}) , (entity2:Org{name:data.name4})
with entity1,entity2
CREATE (entity1)-[:rel]→(entity2)

3. 数据备份，数据恢复

3.1）离线备份

1）先 docker stop 原来的容器

docker stop neo4j

2）开始数据冷备

重新启动一个临时容器进行备份

docker run --interactive --tty --rm \
--volume=/home/data/neo4j/data:/data \
--volume=/home/data/neo4j/data/db-backup:/backups \
--volume=/etc/localtime:/etc/localtime \
neo4j:4.4.16-community \
neo4j-admin dump --database=neo4j --to=/backups/`date +%Y%m%d_%H:%M`.dump

3）数据恢复

同样是在 Neo4j 停机状态下进行数据恢复

docker run --interactive --tty --rm \
--volume=/home/data/neo4j/data:/data \
--volume=/home/data/neo4j/data/db-backup:/backups \
neo4j:4.4.16-community \
neo4j-admin load --database=neo4j --from=/backups/xxxx.dump

3.1）在线备份

在线备份：数据备份与恢复无需停机。

离线备份：数据备份与恢复需要停机。

注意：这是企业版的 Neo4j，社区版本不支持热备。

1）开始数据热备

docker exec --interactive --tty neo4j-new neo4j-admin backup --database=neo4j --to=/backups/`date +%Y%m%d_%H:%M`.back

2）数据恢复

docker exec --interactive --tty neo4j-new neo4j-admin backup --backup-dir=/backups/xxx.back

四、技术架构的演进

4.1 实际项目中，使用neo4j作为底层的数据库，我们就要考虑该技术的高可用性，安全性，以及并发性能如何等问题。所以目前市面的技术架构是如何做的，

以及是否还有其他的瓶颈，市场上是否有其他可替代品等等问题，就是我们在这个时候需要考虑的问题。

五、其他类型的图数据库有哪些

1） Amazon Neptune

Amazon Neptune - 为云构建的快速、可靠的图形数据库

Amazon Neptune 是一项快速、可靠且完全托管的图形数据库服务，可帮助您轻松构建和运行使用高度互连数据集的应用程序。Amazon Neptune 的核心是专门构建的高性能图形数据库引擎，它进行了优化以存储数十亿个关系并将图形查询延迟降低到毫秒级。 Amazon Neptune 支持常见的图形模型 Property Graph 和 W3C 的 RDF 及其关联的查询语言 Apache TinkerPop Gremlin 和 SPARQL，从而使您能够轻松构建查询以有效地导航高度互连数据集。Neptune 支持图形使用案例，如建议引擎、欺诈检测、知识图谱、药物开发和网络安全。

Amazon Neptune 具有高可用性，并提供只读副本、时间点恢复、到 Amazon S3 的持续备份以及跨可用区复制等功能。Neptune 非常安全，可支持 HTTPS 加密客户端连接和静态加密。Neptune 完全托管，因此，您再也无需担心数据库管理任务，例如，硬件预置、软件修补、设置、配置或备份。