原因
我需要导入CN-DBpedia到Neo4j中,包含900万+的百科实体以及6700万+的三元组关系,普通逐条插入可能速度太慢,所以要使用neo4j-admin命令来进行导入。
CN-DBpedia原始数据直提供了txt格式的三元组数据,需要进行数据预处理,形成node.csv和relation.csv两个文件,代码见GitHub CN-DBpedia-To-Neo4j。关于数据预处理和neo4j-admin的命令解释可以参考这个教程。
我本来是用neo4j desktop导入的,会莫名其妙地断开连接,据说desktop版本没有压缩版本好。本文会介绍两种neo4j版本的导入方法,建议选择压缩版。
一、压缩版步骤
1. 解压
解压后会看到这个文件夹,将node.csv和relation.csv放到import文件夹下,用cmd管理员模式进入bin目录
2. 试运行数据库
输入命令neo4j.bat console,应该可以看到启动的反馈。