目前课题组有基于Kubernetes和Dockers的集群以及阿里云镜像托管仓库,我们以往建立的知识图谱都是在本机有数据备份,怎么将他们导出到集群环境的Neo4j中呢?
- 本机数据导出
Neo4j Desktop提供很多功能,但是一键导出功能根据每个人的环境不同会有各种问题,所以不建议使用,可以用如下方式生成数据打包文件,注意以下操作在数据库实例未开启的情况下完成:
1.选择需要导出的数据库实例,然后选择Terminal
2.打开Terminal之后可以输入如下命令:
cd bin
neo4j-admin dump --database=neo4j --to=[你定义的名字].dump
此处–database默认就是neo4j,改成其他名称也会有问题。
导出之后可以在此处查看导出的文件:
如下,导出成功
- Docker容器环境下的数据导入
首先需要说明的一点是,Docker Hub上Neo4j官网提供的版本应该是社区版(Community Version),虽然有很多使用上的不同,但是数据导入导出还是可以互通的。
首先创建好docker环境下的Neo4j,命令如下:
docker pull neo4j
docker images #查看镜像
docker run \
--publish=7474:7474 --publish=7687:7687 \
--volume=$HOME/neo4j/data:/data \
neo4j
然后查看容器的id:
docker ps -a|grep neo4j
自此准备工作结束。
1.将数据文件拷贝到容器中:
docker cp ./giao.dump [你的容器id]:var/lib/neo4j/
可以使用进入容器查看是否拷贝成功:
docker exec -it [你的容器id] bash
2.Neo4j Desktop和Neo4j Community在数据库启动时不能对当下激活的数据库进行导出或者导入操作,因此可以导入到另一个数据库(会自动创建)
neo4j-admin load --from=./giao.dump --database=test
由于Neo4j Community默认激活的数据库为名为“neo4j”的数据库,所以这并不影响test数据库的数据导入操作。
3.Neo4j Desktop和Neo4j Community每次只能启动一个数据库实例,不过Neo4j Community只能显示指定默认的数据库,每次需要更换时需要修改配置文件。
在容器内部进入conf目录,修改neo4j.conf
修改如下内容处。
# The name of the default database
#dbms.default_database=neo4j
添加一行dbms.default_database=test
。
4.重新启动容器,在容器内部使用neo4j restart
或neo4j stop
都会导致容器退出,需要手动开启容器:
docker start [容器id]
5.接着在浏览器通过访问ip:7474就可以查看导入的数据了,记得切换激活的数据库,就是图中有小房子的代表当下激活的数据库实例:
6.过程中可能会遇到私有网络跨域警告问题,可以采用这个方式解决(chrome 浏览器):
首先在谷歌浏览器中输入chrome://flags/#block-insecure-private-network-requests
,进入如下页面,搜索insecure,勾选Block insecure private network requests 为Disabled 即可,随后浏览器会重启,配置生效:
最终效果:
数据敏感,打个码,清楚原理即可