Constructing Compact Time Series Index for Efficient Window Query Processing(ICDE2022)

近年来,时间序列的分析与挖掘在学术界和工业界得到了广泛的研究。给定一组长时间序列,数据分析人员可以利用基于窗口的相似性搜索来探索任意时间窗口下的子序列。现有技术不能有效地处理基于窗口的查询。特别地,整个匹配索引方法需要为每个窗口建立单独的索引,会产生巨大的空间开销现有的基于窗口的聚类方法只能对相邻窗口进行聚类,导致聚类结果松散,降低了查询处理效率本文提出了一种紧凑的时间序列索引WinIdx,用于高效的窗口查询处理。WinIdx通过挖掘子序列之间的相似性,为簇内窗口提供了一种紧凑的索引结构;WinIdx采用了多种优化技术(如可排序摘要、摘要包络等)来提高索引构建、查询处理和索引覆盖的效率。在真实和合成时间序列上进行了广泛的实验,证明了WinIdx相对于最先进方法的优越性。

问题:

 方法:

虽然WinIdx仍然利用窗口聚类机制,但从不同的角度考虑窗口之间的相似性。也就是说,如果两个窗口中的子序列之间的关系相似,则认为两个窗口相似。基于关系的相似性度量使得WinIdx在窗口不是相邻子序列或波动剧烈的时间序列时仍然具有良好的性能。对于每个集群,WinIdx构建一个统一的索引WTree,以表示包含在该集群中的所有窗口。每个WTree由一个完整的匹配索引和一些简洁的索引组成。此外,我们对WinIdx方案的理论分析保证了聚类的效率和收敛性

 框架:

 IV. THE WINIDX INDEX

 为了支持W中的查询,我们将W中的所有窗口分组为不同的簇。对于每个簇Ci,将构建一个紧凑索引(即WTreei),以支持属于Ci的所有窗口查询。WTreei是由两个核心组件组成的二叉树:串联组织和SAX包络。图3显示了一个WTree的例子。首先,我们在一个简单的情况下引入它们,其中Ci只包含一个窗口,例如W

 SAX envelope

在WTreei中,任意节点(无论是内部节点还是叶节点)都包含一个所包含子序列的摘要,称为SAX包络,它可以通过提供查询与节点中序列之间的下界距离来修剪不必要的节点遍历。

 

我们使用图4来说明SAX信封的作用。节点n包含4个序列T1, T2, T3, T4,我们注意图中颜色较粗的线,表示每个线段上序列的平均值。 

 Tightness of envelopes: 

 我们的结论是,顺序序列导致更紧密的信封和更高的剪枝效率。这就是我们基于序列顺序对窗口进行聚类的原因。

实验部分:

 

 

 在图6中的 top-k查询中,winidx效果并没有比coconut的效果好很多,基本上一致,但在索引大小上明显winidx的索引大小要小很多,这个和文中所采用的分组压缩窗口内索引的做法有直接关系

 从实验结果看出来,文中在精确查询结果和近似查询结果的精度明显没有coconut的效果好,这说明windin的在查询效果方面 没有效果

 在索引创建时间方面,windin没有明显的优于DCI的索引效果,在整个索引创建时间上面。同时应该看到随着sliding step的增加,索引花费的时间大部分在磁盘i/o上面,其实这是一个可以优化的点。因为在索引创建和聚类方面时间的花销相对均衡。

 

读者总结:这篇论文在写作上很明显的指出了 与之前两个工作的明显差异之处,也进行了定性的分析,很遗憾地没有实现定量的分析。DCI和coconut是两个在处理大规模时间序列相似性查询方面比较有特色的两个索引算法。其次这篇论文在实验部分还是很详实的比较了算法设计参数的各个方面,但是从实验部分看,winidx在近似查询和精确查询方面并没有优于传统的DCI和cocount的效果,并且在索引创建时间和索引大小方面也没有大的提高,只是在剪枝效率方面有明显的提高,其次windix算法的i/o成本很高,其实可以和DCI以及coconut进行对比,实现一些在索引创建方面的优化。总之从实验结果来看,没有觉得winidx 索引的强优势。

最后,文中的索引算法设计的核心是,对相似窗口分组压缩,在压缩结果上创建索引。1)分组压缩采用相似窗口聚类 ;2)创建wintree,主要是在分组结构基础上,采用类似isax的方法,利用外矩形实现上下界。这些设计思路在时间序列相似性查询中是很常见的技术。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值