师兄的话

数据迁移:

在cmd环境中:

neo4j-admin load --from=/你的目录/cn_dbpedia_neo4j.dump --database=graph.db --force

neo4j-admin load --from=/xx/neo4j-community-3.5.3/bin/cn_dbpedia_neo4j.dump
--database=graph.db --force

运行上述命令,出现“未能加载该模块”(安装时的红色报错),则按照安装时的修改,修改neo4j-admin.ps1文件中的import modul的路径,将相对路径改为绝对路径。

 有三点说明哈:

1、在使用neo4j查询之前,一定要先把索引建立好,否则查询起来会非常慢;

2、查询某个点或边,输入给定其值时,一定先用这两条语句处理一下你输入的值:row= re.sub('"|“|”|★|\'','#',data)
        row=re.sub('\n\r|\r\n|\n','',row)。比如match (n{value:'#5·12#汶川特大地震四川灾区教育重建研究'}) return n 查询就是对的,而match (n{value:'"5·12"汶川特大地震四川灾区教育重建研究'}) return n是查不到任何结点的

3、关于m2e.txt,我发现好像其第二列的值在neo4j中都可以查到,第一列查不到,所以你后续分析时注意一下简单的同义词扩展就好。即在neo4j中做查询之前,如果输入的值在m2e.txt中有同义词的话,就把同义词扩展到m2e.txt中的第二列,以第二列作为neo4j的查询输入

 

导入大型知识图谱

数据预处理得到 subject_set.txt 和 object_set.txt两个文件

>恩恩,还有一个问题 你导入数据的使用的是两个实体文件和一个边文件(还是三元组文件)?然后直接用这个命令么:/bin/neo4j-import --into [PATH] --nodes [nodeA.csv] --nodes [nodeB.csv] --relationships [C.csv]

>sudo neo4j-admin import --nodes:Subject="/home/fu/Desktop/import_cndbpedia/set/subjectNodeHeader_set.txt,/home/fu/Desktop/import_cndbpedia/set/subject_set.txt" --nodes:Object="/home/fu/Desktop/import_cndbpedia/set/objectNodeHeader_set.txt,/home/fu/Desktop/import_cndbpedia/set/object_set.txt" --relationships:Predicate="/home/fu/Desktop/import_cndbpedia/set/baike_triplesHeader_set.txt,/home/fu/Desktop/import_cndbpedia/set/baike_triples_clean_set.txt" --delimiter="\t" --high-io=true --ignore-missing-nodes=true  --ignore-duplicate-nodes=true

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值