关于bloom filter以及原理,见我之前转的这篇:
http://blog.csdn.net/inte_sleeper/article/details/7824857
下面开始实战篇。google guava包是包含了一个bloom filter的实现的,使用方式比较简单,其实就是一行代码:
BloomFilter<CharSequence> filter = BloomFilter.create(Funnels.stringFunnel(), 10000000, 0.001F);
上面的代码创建了一个以string为key的bloom filter,预期的插入量是1KW,错误率是0.1%。
查询的时候,直接调 filter.mightContain()方法就可以,非常简单。
下面开始说坑吧。guava的BloomFilter,内部的一段实现代码如下:
public static <T> BloomFilter<T> create(Funnel<T> funnel, int expectedInsertions,
double falsePositiveProbability) {
checkNotNull(funnel);
checkArgument(expectedInsertions >= 0, "Expected insertions cannot be negative");
checkArgument(falsePositiveProbability > 0.0 & falsePos