主要工作
-
关于q的全局skyline粗粒度的概念
用粗粒度支配关系计算全局skyline点集 -
基于反向网格索引的MapReduce并行算法,利用MapReduce计算全局网格,加速动态skyline查询的计算
MapReduce过程:
索引的表示:
- 检查全局skyline点中的动态skyline点
首先访问查询点周围的数据点得到全局,然后逐个扫描得到动态skyline点
核心
1.提出了首先根据支配关系计算全局skyline点得到少量的数据集,从而再算动态skyline点的时候可以大量减少需要访问的数据
2.利用MapReduce编程框架,实现并行计算网格索引过程,这样可以减少运行时间
步骤
- 反向网格索引(利用MapReduce)
- 全局skyline计算(全部数据,根据支配关系进行剪枝)
- 动态skyline计算(这时数据较少)
全文算法流程
首先将原始数据映射到网格中,然后用粗粒度支配关系计算全局skyline点集,最后在少量数据处进行动态skyline查询
用伪代码表示如下: