您的数据可以在RDF中表示为data.n3:
@prefix : .
@prefix rdfs: .
:Network rdfs:subClassOf :Main .
:ATM rdfs:subClassOf :Network .
:ARPANET rdfs:subClassOf :Network .
:Software rdfs:subClassOf :Main .
:Linux rdfs:subClassOf :Software .
:Windows rdfs:subClassOf :Software .
:XP rdfs:subClassOf :Windows .
:Win7 rdfs:subClassOf :Windows .
:Win8 rdfs:subClassOf :Windows .
从这里开始,您只需要一个SPARQL查询,该查询通过rdfs:subClassOf属性的路径(包括空路径)查找连接到特定类的所有内容.
prefix :
prefix rdfs:
select ?superclass where {
:Win7 rdfs:subClassOf* ?superclass
}
--------------
| superclass |
==============
| :Win7 |
| :Windows |
| :Software |
| :Main |
--------------
prefix :
prefix rdfs:
select ?class where {
:Win7 rdfs:subClassOf* ?mid .
?mid rdfs:subClassOf* ?class .
}
group by ?class
order by count(?mid)
这找到了每个祖先?类:Win7以及每个中间的中间祖先.对于祖先?类,距离计算为中间关系的数量(count(?mid)).它根据距离对结果进行排序,因此:Win7是最接近的祖先,之后是Windows,依此类推.
你甚至可以做一些你想要的花哨格式:
prefix :
prefix rdfs:
select (group_concat( ?name ; separator="--" ) as ?path) where {
{
select ?name where {
:Win7 rdfs:subClassOf* ?mid .
?mid rdfs:subClassOf* ?class .
bind( strAfter( str(?class), "http://example.org/") as ?name )
}
group by ?class ?name
order by count(?mid)
}
}
-----------------------------------
| path |
===================================
| "Win7--Windows--Software--Main" |
-----------------------------------
有可能做一些更高级的字符串处理并获得多行字符串.您可能会看一下this answer的后半部分,其中有一些花哨的格式,可以很好地对齐想法的矩阵.