实际上是一个很长的二进制向量和一系列随机映射函数。其可以用于检索一个元素是否在一个集合中。
优点:空间效率和查询时间都远远的超过一般算法,
缺点:有一定的误识别率和删除困难。
类型:
NONE:没有
ROW:行键
ROWCOL:行键+列
使用布隆过滤器的根本原因:
默认机制决定了一个存储文件是否包含特定的受限于可用块索引的行键,同时这个索引又是相当粗粒度的,该索引只存储了文件包含块的开始键。
另一方面,使用布隆过滤器的好处是,用户可以立即判断一个文件是否包含特定的行键。
使用行级还是行加列级布隆过滤器:这取决于用户的使用模式