<!-- google guava 代码美化工具类 -->
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>27.0-jre</version>
</dependency>
测试代码:
public static void main(String[] args) {
BloomFilter<String> bloomFilter = BloomFilter.create(Funnels.stringFunnel(Charset.defaultCharset()), size,
0.01);
int size=1000000;
List<String> strings = new ArrayList<>();
for (int i = 0; i < size; i++) {
String ss = "string" + i;
bloomFilter.put(ss);
strings.add(ss);
}
//method no.1 判断存在数据的存在验证
for (String item : strings) {
if (!bloomFilter.mightContain(item)) {
System.out.println("已存在的数据误判" + item);
}
}
//method no.2 以下直接测试不存在数据的误判情况.
for (int i = 1; i < 20000; i++) {
int j = 1000000 + i;
if (bloomFilter.mightContain("string" + j)) {
// 布隆过滤器. 当返回false时,必定是不存在. 当返回存在的时候也可能是不存在的情况.
//bloomFilter.mightContain(object)为true 那么真是数据不一定存在.
//如果为false,那么必定是不存在.用来过滤不存在的资源;
System.out.println("误判" + i);
}
/*
* 布隆过滤器 1.用已验证用户登录/用户注册时,账号是否存在; 2.缓存击穿,将已存在的缓存放到布隆中,当黑客访问不存在的缓存时迅速返回避免缓存及DB挂掉;
* BloomFilter.mightContain(object obj){存在数据的数据必定返回true,不存在可能返回true.},返回false
* 必定不存在.(我在里有一个误区,一直在想布隆在数据量验证真或假的问题. 却没有想到,用过滤器去减少无效读的操作[变相的减少了服务器的压力].
* 其实这个问题换个角度想一想:如果数据库存在200w真实数据(唯一标示:_uid),但外界有1000w次请求.每次的_uid不同.
* 如果不加入过滤器的话.那么读的操作会进行1000w次(不论是否存在) 如果加入过滤器.误判(不存在的会认为存在)率1%的话,那误读次数:100w次.
* 最终流入对DB`缓存的读的次数:300w次. DB`缓存减少了700w次读操作. 由此可以节省多少资源. 仅此笔记.记录自己对布隆过滤器的理解.)
*/
}
}
主要应用也写在注释里了.
希望可以给需要的朋友一些帮助;