《RDF Graph Partitions: a Brief Survey》——笔记

Abstract

给出图分割的理由和解决方案。使用经典图形理论解决图分割问题。提出四种将RDF图转换为古典图形的方法。

Introduction

语义Web和Linked Data environments的核心数据模型。
RDF图规模太大,无法单机处理。早期的解决方法来此RDBMS。

Preliminaries

RDF是一个非常一般的数据模型,用于描述资源和他们之间的关系。
**Definition 2.1 (Subject, predicate and object).**Subject——资源,object——关系的值,谓词表示资源的特征或方面,并表示subject和object的关系。
**Definition 2.2 (RDF triple).**Assume that I is the set of all Internationalized Resource Identifier (IRI) references, B an infinite set of blank nodes, L the set of RDF literals. An RDF triple t is defined as a triple t=<s,p,o> where sLB is called the subject, pL is called the predicate and oIBL is called the object.
Definition 2.3 (IRIs) IRIs serve as global identifiers that can be used to identify any resource.
Definition 2.4 (Literals) Literals are a set of lexical values.包含字符串和数据类型。
Definition 2.5 (Blank nodes) existential variables used to denote the existence of some resource for which an IRI or literal is not given.
Definition 2.6 (RDF graph) let L=LSLLLD,O=IBL and S=IB , then GS×I×O is a finite subset of RDF triples, which is called RDF graph.
报警了, 这个定义是什么鬼?
Definition 2.7 (Directed labeled graph) Directed labeled graph G is a quadruple G=(V,E,lbl,L) , where V is a set of vertices, E={(v1,v2)|v1,v2V} is a set of directed edges, lbl:EVL is a labeling function, and L is a set of labels.
Definition 2.8 (k-way graph partition) Given a graph G=(V,E,lbl,L) , a k-way graph partitioning, C, is a division of V into k partitions {P1,P2,...,Pk} such that 1ikPi=V , and PiPj= for any ij

RDF Graph Partition

Classical Graph Partitioning

最被认可的图划分算法是在METIS软件包中的gpmetis。gpmetis基于多级图分割,有三个阶段:图粗化,初始分区,图解析。粗化阶段,通过将相邻顶点对尽量折叠在一起,将输入图转化成一系列较小的图。初始分区,当所得到的图形足够低时,使用kernighan-Lin算法进行分割。解析阶段,分区展开被折叠的顶点,投影成较大的图。

3.2 Relation Between Classical Graphs and RDF Graphs

所有的图划分算法(graph partitioning algorithms)都可被用在RDF图中,如果他们转化为classical graph表示。三元组的转换是最简单的情况。
对于三元组 t=<s,p,o> 其中 sIB,pL,oIBL 被转换成有向边 spo ,其中 s,oV,pL
问题:三元组中p和s、o是相交的,但边中 p s,o 不相交。
解决方法

  1. <s,p,o> <script type="math/tex" id="MathJax-Element-7461"> </script> 转换为 v1(s)pv2(o) 其中 v1,v2V 并且 s,p,oL
  2. 转换为超图,即可以让边连接多于两个节点,这种方法s,p,o都被转化成顶点。但需要为其专门设计算法,且效率不如简单图。
  3. 以超图为起点,将RDF图转换成二分图。如下图
    这里写图片描述
  4. 将每个RDF三元组转换成不同的图形节点,并在共享主题,对象和/或谓词的那些节点之间生成边。

RDF比传统图更通用,有向有标记的图可以很容易转换成RDF图,但是反向变换很麻烦。这意味着每个RDF图的问题的复杂性并不比相应的经典图形问题的复杂性要好。
这里也不太懂。。

Experiment

第四种方法不如第一种好。

Conclusions

提出了RDF图分区研究领域的工作,提供了RDF图的经典图分割的见解,觉少了古典图和RDF图之间的形式关系。
We outlined a partition of the vertices of an RDF graph into two disjoint subsets. In this paper we presented works from the RDF graph partitions research area. This paper provided insights on classical graph partitioning of RDF graphs. Moreover, we presented formal relationships between classical graphs and RDF graphs. Finally, we presented experiments, which showed a great potential for the presented approaches.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值