实践篇（四）：Apache jena SPARQL endpoint及推理

最新推荐文章于 2024-08-07 09:52:41 发布

simmerchan

最新推荐文章于 2024-08-07 09:52:41 发布

阅读量6.4k

点赞数 6

分类专栏：知识图谱文章标签：知识图谱 apache jena jena sparql

本文链接：https://blog.csdn.net/u011801161/article/details/79185464

版权

本文介绍了Apache Jena，一个用于构建语义网和链接数据应用的Java框架，以及如何使用Jena的TDB、Fuseki和规则推理机。通过实践展示了如何设置Fuseki SPARQL服务器，加载RDF数据，进行OWL推理，并通过规则推理创建新的事实。文章还提及了Jena的Python SPARQL查询示例和如何在实际开发中使用Jena的API接口。

摘要由CSDN通过智能技术生成

对知识图谱有兴趣的读者可以关注我的知乎专栏，主要介绍知识图谱的相关概念、技术，也包含一些具体实践。

在上一篇我们学习了如何利用D2RQ来开启endpoint服务，但它有两个缺点：
1. 不支持直接将RDF数据通过endpoint发布到网络上。
2. 不支持推理。

这次我们介绍的Apache jena能够解决上面两个问题。

一、Apache Jena简介

Apache Jena（后文简称Jena），是一个开源的Java语义网框架（open source Semantic Web Framework for Java），用于构建语义网和链接数据应用。下面是Jena的架构图：

本次实践我们会用到的组件有：TDB、rule reasoner和Fuseki。
1. TDB是Jena用于存储RDF的组件，是属于存储层面的技术。在单机情况下，它能够提供非常高的RDF存储性能。目前TDB的最新版本是TDB2，且与TDB1不兼容。
2. Jena提供了RDFS、OWL和通用规则推理机。其实Jena的RDFS和OWL推理机也是通过Jena自身的通用规则推理机实现的。
3. Fuseki是Jena提供的SPARQL服务器，也就是SPARQL endpoint。其提供了四种运行模式：单机运行、作为系统的一个服务运行、作为web应用运行或者作为一个嵌入式服务器运行。

Jena目前是使用最广泛、文档最全、社区最活跃的一个开源语义网框架。更多的细节，读者可以参考官方文档。

二、Fuseki与OWL推理实战

我们先下载Jena的最新版本（fuseki和其他的功能模块不在同一个文件中，需要分别下载apache-jena和apache-jena-fuseki）。后续操作以Windows为例，Linux类似，只是脚本位置不同。

创建一个目录（我这里命名为“tdb”）用于存放tdb数据。进入“apache-jena-X.X.X”文件夹的bat目录，可以看到很多批处理文件，我们使用“tdbloader.bat”将之前我们的RDF数据以TDB的方式存储。命令如下：

.\tdbloader.bat --loc="D:\apache jena\tdb" "D:\d2rq\kg_demo_movie.nt"

“–loc”指定tdb存储的位置，即刚才我们创建的文件夹；第二个参数是由Mysql数据转换得到的RDF数据。

进入入“apache-jena-fuseki-X.X.X”文件夹，运行“fuseki-server.bat”，然后退出。程序会为我们在当前目录自动创建“run”文件夹。将我们的本体文件“ontology.owl”移动到“run”文件夹下的“databases”文件夹中，并将“owl”后缀名改为“ttl”。在“run”文件夹下的“configuration”中，我们创建名为“fuseki_conf.ttl”的文本文件（取名没有要求），加入如下内容：

@prefix :      <http://base/#> .
@prefix tdb:   <http://jena.hpl.hp.com/2008/tdb#> .
@prefix rdf:   <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix ja:    <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix rdfs:  <http://www.w3.org/2000/01/rdf-schema#> .
@prefix fuseki: <http://jena.apache.org/fuseki#> .


:service1        a                fuseki:Service ;
fuseki:dataset                    <#dataset> ;
fuseki:name                       "kg_demo_movie" ;
fuseki:serviceQuery               "query" , "sparql" ;
fuseki:serviceReadGraphStore      "get" ;
fuseki:serviceReadWriteGraphStore "data" ;
fuseki:serviceUpdate              "update" ;
fuseki:serviceUpload              "upload" .


<#dataset> rdf:type ja:RDFDataset ;
    ja:defaultGraph <#model_inf> ;
    .

<#model_inf> a ja:InfModel ;
    ja:baseModel <#tdbGraph> ;

    #本体文件的路径
    ja:content [ja:externalContent <file:///D:/apache%20jena/apache-jena-fuseki-3.5.0/run/databases/ontology.ttl> ] ;

    #启用OWL推理机
    ja:reasoner [ja:reasonerURL <http://jena.hpl.hp.com/2003/OWLFBRuleReasoner>] .

<#tdbGraph> rdf:type tdb:GraphTDB ;
    tdb:dataset <#tdbDataset> ;
    .

<#tdbDataset> rdf:type tdb:DatasetTDB ;
    tdb:location "D:/apache jena/tdb" ;
    .

再次运行“fuseki-server.bat”，如果出现如下界面表示运行成功：

Fuseki默认的端口是3030，浏览器访问“http://localhost:3030/”，和之前介绍的D2RQ web界面类似，我们可以进行SPARQL查询等操作。在Python中用SPARQLWrapper向Fuseki server发送查询请求:

PREFIX : <http://www.kgdemo.com#>
PREFIX rdf: <http://www.w3.org/19

最低0.47元/天解锁文章

simmerchan

关注

6
点赞
踩
20

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录