gStore：Answering SPARQL Queries via Subgraph Matching

最新推荐文章于 2024-07-11 21:41:59 发布

琳酱我爱你

最新推荐文章于 2024-07-11 21:41:59 发布

阅读量236

点赞数 1

分类专栏：论文浅尝文章标签：数据库知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/loveandstory/article/details/108709455

版权

论文浅尝专栏收录该内容

3 篇文章 0 订阅

订阅专栏

2011

gStore: Answering SPARQL Queries via Subgraph Matching

1.存在问题

1）他们无法以可扩展的方式支持带通配符的SPARQL

例如：

我们可以通过以下SPARQL从RDF数据集中检索1809年2月12日出生并于1865年4月15日去世的人的姓名

在这里插入图片描述
我们可能知道一位重要的政治人物于2月12日出生并于4月15日去世，但我们不知道他的确切出生和死亡年份。在这种情况下，我们必须使用通配符执行查询

2）现有系统对于存储RDF的数据库频繁更新是很困难的

社交网络中的RDF数据（例如FOAF项目（foaf-project.org））也经常更新，以代表个人不断变化的关系

2.解决方法

2.1 主要思路

将RDF数据转换为RDF图，可以通过将SPARQL查询转换为子图匹配查询RDF图

RDF graph ：

1） RDF图的大小（即顶点和边的数量）比典型图数据库考虑的大小大几个数量级。

2）RDF图中顶点和边缘标签的基数比传统图数据库中的基数大得多

3）SPARQL查询结合了同一实体的几多个属性，因此，它们倾向于包含星号作为子查询

在这里插入图片描述

在这里插入图片描述

线下处理：

将dataset 转换为邻接矩阵表->

在这里插入图片描述

将实体或者类顶点进行编码->

将这些顶点签名链接起来以形成数据签名图G *->

在这里插入图片描述

2.2 编码Encoding

将每个相邻的边的标签和对应的相邻顶点的标签编码为位串

1）相邻的边的标签

在这里插入图片描述

how to generate ?

在这里插入图片描述

2）相邻顶点的标签

在这里插入图片描述

在这里插入图片描述

2.3 索引结构和查询算法

在这里插入图片描述

2.3.1 索引结构

how to build a VS-tree?

1)built S-tree

在这里插入图片描述

2)built VS-tree

在这里插入图片描述

若S-tree中有两个结点的 孩子结点 间至少存在一条边，

就可以引入一条超级边。若有多条边，这条超级边的bitString 为多条边进行或运算的结果

也能够引入一条自己到自己的边，如果该结点的一个孩子

到另外一个孩子之间也存在边

2.3.2 匹配算法

1）定义：

Q^* 在G^* 上的 summary matche

1）结点bitString一样

2）对于查询图Q^*中的任意一条边，都能在G^I中找到一条超级边
在这里插入图片描述

作用：用于缩减查询空间

1)如果在 G¹ 上找不到一个摘要匹配那么Q^*在G^* 上的匹配就不存在

2)在G¹中的一个结点是某个顶点标签 u_i的祖先，那么就一定会形成一个 Q^*在G^* 上摘要匹配

在这里插入图片描述

在这里插入图片描述

Valid child state：

1）是孩子结点

2）是Q^* 的一个摘要匹配

2）算法细节

在查询图Q^* ₃ 里找到他的 summary matches
,将这个summary matches 入队 H
每次从队列H中取一个summary matche，求他的child state

3）从这些子状态中过滤掉没有用的，找到 valid child state

可以达到一个缩减查询空间的效果

4）重复以上过程，直到到达叶子结点

5）最后在叶子结点上进行匹配
在这里插入图片描述

琳酱我爱你

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
gStore：Answering SPARQL Queries via Subgraph Matching

2011gStore: Answering SPARQL Queries via Subgraph Matching1.存在问题1）他们无法以可扩展的方式支持带通配符的SPARQL 例如：我们可以通过以下SPARQL从RDF数据集中检索1809年2月12日出生并于1865年4月15日去世的人的姓名我们可能知道一位重要的政治人物于2月12日出生并于4月15日去世，但我们不知道他的确切出生和死亡年份。在这种情况下，我们必须使用通配符执行查询 2）现有系统对于存储RDF的数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。