Stacked Filters: Learning to Filter by Structure
我们提出了堆栈过滤器,一种新的概率过滤器,它的速度和健壮性类似于查询不可知的过滤器(如Bloom和Cuckoo过滤器),同时带来较低的假阳性率和大小,类似于基于类er的过滤器(如学习过滤器)。其核心思想是,Stacked Filters将关于频繁查询的不存在值的工作负载知识结合起来。他们不是学习,而是使用哈希和几个排序的lter层在结构上整合这些知识,为数据和经常出现的负面信息建立索引。堆栈过滤器还可以在-y上收集工作负载知识,并自适应地构建lter。我们通过实验证明,对于给定的内存预算,堆栈过滤器实现的端到端查询吞吐量比工作负载的最佳替代方案(查询不可知的或基于类er的lters)高130倍,并且取决于数据的位置(SSD或HDD)。
一研究问题
结构化地封装工作负载信息