知识图谱 KBQA Demo：fuseki sparql python 版本问题详细解决方案

最新推荐文章于 2020-04-26 09:17:56 发布

一路是夜幕沉沙

最新推荐文章于 2020-04-26 09:17:56 发布

阅读量3.2k

点赞数 8

分类专栏：知识图谱 Python 文章标签：知识图谱 python

本文链接：https://blog.csdn.net/sculpta/article/details/104418580

版权

知识图谱同时被 2 个专栏收录

2 篇文章 1 订阅

订阅专栏

Python

2 篇文章 0 订阅

订阅专栏

刚入坑知识图谱，看了一位大神的教程，但是由于 jena、fuseki、python 等版本不同，踩了不少坑，特此记录一下

本文不做具体知识的讲解（具体知识可移步 https://zhuanlan.zhihu.com/knowledgegraph），仅罗列实践过程中遇到的坑及解决方案

以下内容大多从教程下面几百条评论中提炼总结而来

环境版本

jena ：3.14.0
fuseki ：3.14.0
jdk ：1.8.0_201
python ：3.7.6
anaconda ：4.8.2

具体问题及解决方案

1. 通过 D2RQ 生成 mapping 文件

此时须打开 MySQL 服务，进入 D2RQ 目录

generate-mapping -u root -p 密码 -o kg_demo_movie_mapping.ttl jdbc:mysql:///kg_demo_movie?useSSL=false

-u ：指定 mysql 用户名
-p ：指定用户密码
-o ：指定输出文件路径及名称
jdbc:mysql:/// 后面指定 mysql 中的数据库名称

对于博主的 kg_demo_movie 项目，mapping 文件生成后还需要修改，所以直接使用博主 GitHub 仓库中的 mapping 文件即可

2. 通过 D2RQ 将数据转为 RDF

同样需要打开 MySQL 服务，在 D2RQ 目录下

.\dump-rdf.bat -o kg_demo_movie.nt .\kg_demo_movie_mapping.ttl

3. 添加环境变量

在系统变量中，添加以下变量

JENA_HOME ：jena 压缩包的解压位置，例如 D:\apache-jena
FUSEKI_HOME ：fuseki 压缩包的解压位置，例如 D:\apache-jena\apache-jena-fuseki

在系统变量中，追加以下变量

CLASSPATH ：追加 %JENA_HOME%\lib
path ：添加 %JENA_HOME%\bin、%JENA_HOME%\bat、%FUSEKI_HOME%

4. 通过 Jena 将 RDF 数据以 TDB 方式存储

存放在 jena 的 tdb 目录下

.\tdbloader.bat --loc="D:\apache-jena\tdb" "D:\D2RQ\kg_demo_movie.nt"

5. 使用 OWL 推理机

注意：博主用的 fuseki 3.5 版本，其中不少语法在 3.14 版本中已经有所改动，所以直接使用下面的配置文件，只需修改其中本体文件及 TDB 的路径即可

@prefix :      <http://base/#> .
@prefix tdb:   <http://jena.hpl.hp.com/2008/tdb#> .
@prefix rdf:   <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix ja:    <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix rdfs:  <http://www.w3.org/2000/01/rdf-schema#> .
@prefix fuseki: <http://jena.apache.org/fuseki#> .

<#service1>       rdf:type            fuseki:Service ;
    fuseki:name                       "kg_demo_movie" ;
    fuseki:serviceQuery               "sparql" ;
    fuseki:serviceQuery               "query" ;
    fuseki:serviceUpdate              "update" ;
    fuseki:serviceUpload              "upload" ;
    fuseki:serviceReadWriteGraphStore "data" ;
    fuseki:serviceReadGraphStore      "get" ;
    fuseki:dataset                    <#dataset> ;
    .


<#dataset> rdf:type ja:RDFDataset ;
    ja:defaultGraph <#model_inf> ;
    .

<#model_inf> rdf:type ja:InfModel ;
    ja:MemoryModel <#tdbGraph> ;

    #本体文件的路径
    ja:content [ja:externalContent <file:///D:/apache-jena/apache-jena-fuseki/run/databases/ontology.ttl> ] ;

    #启用OWL推理机
    ja:reasoner [ja:reasonerURL <http://jena.hpl.hp.com/2003/OWLFBRuleReasoner>] .

<#tdbGraph> rdf:type tdb:GraphTDB ;
    tdb:dataset <#tdbDataset> ;
    .

<#tdbDataset> rdf:type tdb:DatasetTDB ;
    tdb:location "D:/apache-jena/tdb" ;
    .

注意：修改配置文件后，还需要将 RDF 数据（即 .nt 文件）上传到 fuseki 中，如图（这个坑真的填了好久 ···）

6. 自定义推导规则

注意：rules.ttl 文件中需要用逗号隔开，如下

@prefix : <http://www.kgdemo.com#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

[ruleComedian: (?p :hasActedIn ?m), (?m :hasGenre ?g), (?g :genreName '喜剧') -> (?p rdf:type :Comedian)]
[ruleSymmetric: (?p :hasActedIn ?m) -> (?m :hasActor ?p)]

7. 运行最终 Demo

注意：博主使用的是 python2，其中许多语法在 python3 中也有所改动，修改方法如下

所有的 .decode('utf-8')、.encode('utf-8') 全部删掉，即全部替换为 ''
所有的 iteritems() 替换为 items()
所有的 print content 替换为 print(content)，print 替换为 print('\n')
所有的 raw_input() 替换为 input()
question2sparql.py 文件中第 44 行 return queries_dict.values()[0] 改为 return list(queries_dict.values())[0]

附 PyCharm 全局替换的方法，如图

最终效果

一路是夜幕沉沙

关注

8
点赞
踩
22

收藏

觉得还不错? 一键收藏
19
评论
知识图谱 KBQA Demo：fuseki sparql python 版本问题详细解决方案

刚入坑知识图谱，看了一位大神的教程，但是由于 jena、fuseki、python 等版本不同，踩了不少坑，特此记录一下本文不做具体知识的讲解（具体知识可移步 https://zhuanlan.zhihu.com/knowledgegraph），仅罗列实践过程中遇到的坑及解决方案以下内容大多从教程下面几百条评论中提炼总结而来环境版本jena 3.14.0fuseki 3.14.0jd...
复制链接

扫一扫

专栏目录