布隆过滤器BloomFilter 简单例子和一些自己想到的应用.

最新推荐文章于 2024-07-31 11:17:00 发布

weixin_37971341

最新推荐文章于 2024-07-31 11:17:00 发布

阅读量864

点赞数

分类专栏：技术提升文章标签： BloomFilter

本文链接：https://blog.csdn.net/weixin_37971341/article/details/84959232

版权

技术提升专栏收录该内容

5 篇文章 0 订阅

订阅专栏

<!-- google guava 代码美化工具类 -->
		<dependency>
			<groupId>com.google.guava</groupId>
			<artifactId>guava</artifactId>
			<version>27.0-jre</version>
		</dependency>

测试代码:

public static void main(String[] args) {
		BloomFilter<String> bloomFilter = BloomFilter.create(Funnels.stringFunnel(Charset.defaultCharset()), size,
				0.01);
int size=1000000;
		List<String> strings = new ArrayList<>();
		for (int i = 0; i < size; i++) {
			String ss = "string" + i;
			bloomFilter.put(ss);
			strings.add(ss);
		}
//method no.1 判断存在数据的存在验证
                for (String item : strings) {
			if (!bloomFilter.mightContain(item)) {
				System.out.println("已存在的数据误判" + item);
			}
		}

//method no.2 以下直接测试不存在数据的误判情况.
		for (int i = 1; i < 20000; i++) {
			int j = 1000000 + i;
			if (bloomFilter.mightContain("string" + j)) {
				// 布隆过滤器. 当返回false时,必定是不存在. 当返回存在的时候也可能是不存在的情况.
				//bloomFilter.mightContain(object)为true 那么真是数据不一定存在.
				//如果为false,那么必定是不存在.用来过滤不存在的资源;
				System.out.println("误判" + i);
			}
			/*
			 * 布隆过滤器 1.用已验证用户登录/用户注册时,账号是否存在; 2.缓存击穿，将已存在的缓存放到布隆中，当黑客访问不存在的缓存时迅速返回避免缓存及DB挂掉;
			 * BloomFilter.mightContain(object obj){存在数据的数据必定返回true,不存在可能返回true.},返回false
			 * 必定不存在.(我在里有一个误区,一直在想布隆在数据量验证真或假的问题. 却没有想到,用过滤器去减少无效读的操作[变相的减少了服务器的压力].
			 * 其实这个问题换个角度想一想:如果数据库存在200w真实数据(唯一标示:_uid),但外界有1000w次请求.每次的_uid不同.
			 * 如果不加入过滤器的话.那么读的操作会进行1000w次(不论是否存在) 如果加入过滤器.误判(不存在的会认为存在)率1%的话,那误读次数:100w次.
			 * 最终流入对DB`缓存的读的次数:300w次. DB`缓存减少了700w次读操作. 由此可以节省多少资源. 仅此笔记.记录自己对布隆过滤器的理解.)
			 */
			

		}
	}

主要应用也写在注释里了.

希望可以给需要的朋友一些帮助;