Optimizing Subgraph Queries by Combining Binary and Worst-Case Optimal Joins_optimizing one-time and continuous subgraph querie-CSDN博客

本文链接：https://blog.csdn.net/qq_38603546/article/details/106182520

本文关注子图查询优化，提出了一种动态规划优化器，用于生成混合计划，结合了二元连接和最坏情况优化（WCO）连接。优化器基于代价，通过查询点序选择有效扩展部分匹配。文章还介绍了适应性技术，可以在查询执行过程中调整WCO子计划的顺序。

摘要由CSDN通过智能技术生成

本文由滑铁卢大学的Amine Mhedhbi和Semih Salihoglu发表

摘要

本文主要研究子图查询优化问题，并使用新的 worst-case optimal join plans。
worst-case optimal join plans 通过使用多路交叉一次匹配一个查询顶点来评估查询。
其核心问题是选取一个查询点序。

本文中我们设计了一个基于代价的优化器，其作用是：
1、选取有效的查询点序。
2、生成混合计划，包含传统的Binary Join和 worst-case 风格的多路交叉。

同时描述了一个适应性技术，在查询执行中可以改变 worst-case optimal subplans 的序。

1. 相关介绍

子图查询是一个图数据库所支持的基本查询类，用来在一个输入图 $G (V, E)$ 中找到一个子图查询实例 $Q(V_{Q}, E_{Q})$ 。

本文研究评估一个点和边都带有标签的子图查询类。对于有标签的查询，查询边对应的边表只包含G中和点和边标签一致的边。

子图查询使用两种方法评估：

Query-edge(s)-at-a-time
- 执行一个Binary Join序列来评估Q。每个Binary Join有效地匹配G中Q的查询边的更大子集，直到Q匹配为止。
Query-vertex-at-a-time
- 选取一个 $V_{Q}$ 的查询点序，根据查询点序，使用多路连接符，匹配一次查询Q的一个查询点。使用 worst-case optimal join 算法计算，交合一个或多个点邻接列表来扩展部分匹配。

本文主要贡献

第一个主要贡献

动态规划优化器，可生成带有Binary Join和扩展/相交操作符通过一个查询点来扩展部分匹配。
优化器通过两种可替换的方法枚举计划，评估查询Q的k点子查询 $Q_{k}$ ， $k = 2, . . ., m$ ：

两个更小的子查询的Binary Join
通过一次相交，用一个查询点扩展一个子查询 $Q_{k-1}$

优化器使用 intersection cost (i-cost) 来排序 WCO 计划。
i-cost表示一个计划中相交的工作量，其使用计划中要相交的领接表的大小信息。

结合i-cost和Binary的代价来排序混合计划。

代价度量考虑输入图的属性，例如前后邻接表大小的分布，将作为计划的一部分计算的不同子图的匹配数。

我们使用子图目录来估计 i-cost, Binary Join的代价, 计划中会产生的部分匹配的数量。
子图目录包含：
(i) 输入图的领接表大小分布
(ii) 在小子图上对于不同相交的选择

第二个主要贡献

使用适应性技术来选取 WCO 中的查询点序。

2. 初步工作

Generic Join 是 WCO 连接的一个算法，每次计算查询的查询点有两步：

Query Vertex Ordering (QVO)
Iterative Partial Match Extensions

3. Optimizing WCO plans

展示内容：

WCO plans
指定的不同 QVOs 的影响
WCO plans 的 i-cost metric

WCO plans and E/I(Extend/Intersect) operator

使用两个操作符

Scan

计划中的叶节点，匹配一条查询边，使用一个 Scan 操作符来评估。Scan 操作符扫描图G中的前邻接表，匹配查询边上的标签，和它的起始点和终点，并且输出每个匹配成功的边作为 2-match。

Extend/Intersect

E/I操作符接收输入的(k-1)-matches，并将每个元组t扩展到一个或多个k-matches。
操作符配置了一个或多个邻接表描述符和目标点的标签 $l_{k}$
每个操作符是一个(i, dir, $l_{e}$ )元组，i是t中点的索引，dir是前或后的方向， $l_{e}$ 是查询边上的标签。