让Jena帮我们想

metago

于 2008-02-16 08:47:00 发布

阅读量3.6k

点赞数

文章标签： vector object yahoo string query filter

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/metago/article/details/2098277

版权

让Jena帮我们想

----wuhui

谈到互联网的未来，人们自然的想到了语义网，虽然这个概念早在1999年就被伯纳斯－李先生提出，随后被学术界吵得沸沸扬扬，但是，真正基于语义网的应用似乎还处于孵化期。本文当然不想去解释什么是语义网、语义网的体系架构等等知识，本文将结合一个具体应用来说说语义网的一些特性，并由此希望能引起大家对语义网研究的兴趣和信心。

首先，我们来讲讲语义网的数据组织。目前比较常用的还是RDF规范，及其由此衍生的其他标准，例如OWL等。RDF(Resource Description Framework)是以XML为基础的，并结合W 3C 制定的一些规范，从而使其成为一个真正功能强大标记规范。

好，废话少说，下面我们就来建立一个星座的RDF领域知识图。

<rdf:RDF xmlns:rdf="http://www.w3.org/ 1999/02/22 -rdf-syntax-ns#"

xmlns:xingzuo = "http://www.yahoo.com.cn/search/xingzuo/data/">

<xingzuo:Entity>

<xingzuo:name rdf:datatype="http://www.w3.org/2001/XMLSchema#string">白羊座</xingzuo:name>

<xingzuo:start rdf:datatype="http://www.w3.org/2001/XMLSchema#int">321</xingzuo:start>

<xingzuo:end rdf:datatype="http://www.w3.org/2001/XMLSchema#int">420</xingzuo:end>

<xingzuo:mstart rdf:datatype="http://www.w3.org/2001/XMLSchema#int">3</xingzuo:mstart>

<xingzuo:mend rdf:datatype="http://www.w3.org/2001/XMLSchema#int">4</xingzuo:mend>

</xingzuo:Entity>

…

</rdf:RDF>

图1 星座类知识图

熟悉XML的高手一看就知道，这其实就是一个XML的文档，只是有些标签采用了特定的规范。

例如数据类型，表示字符串“string”为

rdf:datatype="http://www.w3.org/2001/XMLSchema#string"

表示整数“int”为

rdf:datatype="http://www.w3.org/2001/XMLSchema#int"

在RDF的模型里，任何关系都是一个Statement，每个Statement由三部分组成：subject、predicate和object。subject和object通过predicate建立关系，其中subject是主语，object是宾语。其他资料，大家可以参考中文版的RDF入门http://wiki.w3china.org/cn/rdfprimer.htm，如果英语够厉害，不妨看看http://www.w3.org/TR/rdf-primer/，此处不在累赘。

有了领域知识，我们就有了基础，呵呵，下面我们就开始来推理查询吧。目前，实现对RDF推理的免费Reasoner比较多，针对网上的评价和资源，我选择了Jena，至于其他的引擎，大家可以Yahoo(http://www.yahoo.cn)一下哦。唉，总算能进入正题了，现在就让我们来开始Jena之旅吧。

在使用之前，我们先简单介绍一下Jena。Jena是面向语义Web的应用开发包，包含的内容比较全面，推理机只是其中一部分，该推理机是针对本体的。至于什么是本体，大家也去Yahoo一下吧J

Jena推理的流程是：

图2 Jena推理流程

下面对每个模块我们来分别介绍：

1. 装载数据

每个领域知识就是一个Ontology Model，因此，我们需要将RDF表述的领域知识装载到一个OntModel中，代码如下：

private OntModel model;

…

FileInputStream file = new FileInputStream(filePath); //filePath为领域库的保存路径

InputStreamReader in = new InputStreamReader(file, "UTF-8"); //文件为UTF-8编码

model = ModelFactory.createOntologyModel();

model.read(in, null);

图3 装载OntModel代码片段

2. 构造查询

有了OntModel，那么该领域的知识就在内存中构造成了一张图，现在我们要做的就是对这个图进行查询了。如果您属于数据库的SQL查询语言，那么对OntModel的查询对您就非常简单了，因为这儿用的是和SQL思想非常类似的SPARQL语言。

我们先来看看SQL和SPARQL的一段对比代码吧。

Select age

From table1

Where name=”张三”

PREFIX test <http://test.cn/search/test/data/>

Select ?age

Where{?x test:name ?name .

?x test:age ?age.

FILTER(?name = “张三”)

}

图4 SQL与SPARQL语法对比

呵呵，是不是很相似啊！SPARQL还有很多超妙的用法，别急着学那个，我还没有讲完呢J（更多内容请参考：

http://www.yahoo.cn/s?p=sparql%E4%BB%8B%E7%BB%8D&v=web&pid=hp）

好的，我们回头看看刚才那个星座类知识库中的Statement属性吧。从图1中我们可以看到，该图的属性有“name、start、end、mstart、mend”，其属性含义解释如下：

Name: 星座名称

Start: 该星座开始时间

End: 该星座结束时间

Mstart: 该星座开始月份

Mend: 该星座结束月份

图5 星座类知识图属性解释

假设，我们现在的需求是“查找9月份的星座”。Ok，首先，我们分析一下这句话的含义：9月份的日子可能出现的星座，由于星座的时间特殊性，那么可能是起始月在9月份，或者是终止月在9月份。那么这个SPARQL就可以写为：

PREFIX xingzuo: http://www.yahoo.com.cn/search/xingzuo/data/

Select ?name

Where{

?x xingzuo:name ?name .

?x xingzuo:mstart ?mstart .

?x xingzuo:mend ?mend .

FILTER(?mstart = 9 || ?mend = 9)

}

图6 SPARQL查询语句实例

上面只是SPARQL语法，那么，在程序中如何执行查询呢？下面的代码会告诉你：

String queryStr = …;

Query query = QueryFactory.create(queryStr);

QueryExecution qe = QueryExecutionFactory.create(query, model);

ResultSet results = qe.execSelect();

图7 Jena查询代码片段

这样的逻辑大家应该都不陌生，因为太想普通的数据库查询逻辑了J

3. 分析结果

走完上面的两步，从图7中我们已经得到查询结果对象results，我们想要的结果找到了，下面让我们来开始“收获”吧：

Vector mxz = new Vector();

while (results.hasNext())

{

QuerySolution tqs = (QuerySolution) results.next();

mxz.addElement(new String(tqs.getLiteral("name").getString()));

}

搞定。

好，现在我们已经通过一个实例介绍了Jena对RDF文件的查询和推理。如果你想玩更酷的功能，请参阅Jena的随包文档。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

metago CSDN认证博客专家 CSDN认证企业博客

码龄20年

17: 原创

120万+: 周排名

139万+: 总排名

3万+: 访问

: 等级

640: 积分

5: 粉丝

1: 获赞

7: 评论

3: 收藏

私信

关注

热门文章

分类专栏

最新评论

让Jena帮我们想
metago: 是的
让Jena帮我们想
Mike2011820: 这篇文是你的原创吗
Linux C++ 面向对象多线程编程实例之“生产者-消费者”
yuanzhuohang: 大哥，这不能称作是面向对象
国家自然科技资源平台资源分类与编码表
metago: 大类代码小类代码一级代码二级代码三级代码代码全称 <br>植物种质资源 11 农作物 11 粮食作物 11 稻类 11 栽培稻 101 11111111101 <br> 野生稻 <br> 杂交稻 <br> 水稻不育系 <br> 水稻保持系 <br> 水稻恢复系 <br> 麦类 13 小麦 <br> 小麦稀有种 <br> 小麦野生近缘植物 <br> 大麦 <br> 野生大麦 <br> 燕麦 <br> 杂粮 15 玉米 <br> 高粱 <br> 谷子 <br> 黍稷 <br> 其它黍类 <br> 荞麦 <br> 豆类 17 大豆 <br> 野生大豆 <br> 绿豆 <br> 蚕豆 <br> 小豆 <br> 豌豆 <br> 豇豆 <br> 普通菜豆 <br>
非常态心理学！
metago: 静待尔的新说！

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。