数据迁移:
在cmd环境中:
neo4j-admin load --from=/你的目录/cn_dbpedia_neo4j.dump --database=graph.db --force
neo4j-admin load --from=/xx/neo4j-community-3.5.3/bin/cn_dbpedia_neo4j.dump
--database=graph.db --force
运行上述命令,出现“未能加载该模块”(安装时的红色报错),则按照安装时的修改,修改neo4j-admin.ps1文件中的import modul的路径,将相对路径改为绝对路径。
有三点说明哈:
1、在使用neo4j查询之前,一定要先把索引建立好,否则查询起来会非常慢;
2、查询某个点或边,输入给定其值时,一定先用这两条语句处理一下你输入的值:row= re.sub('"|“|”|★|\'','#',data)
row=re.sub('\n\r|\r\n|\n','',row)。比如match (n{value:'#5·12#汶川特大地震四川灾区教育重建研究'}) return n 查询就是对的,而match (n{value:'"5·12"汶川特大地震四川灾区教育重建研究'}) return n是查不到任何结点的
3、关于m2e.txt,我发现好像其第二列的值在neo4j中都可以查到,第一列查不到,所以你后续分析时注意一下简单的同义词扩展就好。即在neo4j中做查询之前,如果输入的值在m2e.txt中有同义词的话,就把同义词扩展到m2e.txt中的第二列,以第二列作为neo4j的查询输入
导入大型知识图谱
数据预处理得到 subject_set.txt 和 object_set.txt两个文件
>恩恩,还有一个问题 你导入数据的使用的是两个实体文件和一个边文件(还是三元组文件)?然后直接用这个命令么:/bin/neo4j-import --into [PATH] --nodes [nodeA.csv] --nodes [nodeB.csv] --relationships [C.csv]
>sudo neo4j-admin import --nodes:Subject="/home/fu/Desktop/import_cndbpedia/set/subjectNodeHeader_set.txt,/home/fu/Desktop/import_cndbpedia/set/subject_set.txt" --nodes:Object="/home/fu/Desktop/import_cndbpedia/set/objectNodeHeader_set.txt,/home/fu/Desktop/import_cndbpedia/set/object_set.txt" --relationships:Predicate="/home/fu/Desktop/import_cndbpedia/set/baike_triplesHeader_set.txt,/home/fu/Desktop/import_cndbpedia/set/baike_triples_clean_set.txt" --delimiter="\t" --high-io=true --ignore-missing-nodes=true --ignore-duplicate-nodes=true