java如何实现布隆过滤器

最新推荐文章于 2024-07-31 11:17:00 发布

Java技术攻略

最新推荐文章于 2024-07-31 11:17:00 发布

阅读量182

点赞数

文章标签： java 开发语言 redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ww2651071028/article/details/129829573

版权

布隆过滤器是一种高效的空间节省数据结构，用于判断一个元素是否可能存在在一个大规模集合中。文章介绍了布隆过滤器的基本原理、特点和误判率，并讨论了在MySQL和HashSet中的局限性。接着，详细讲解了Java中如何实现布隆过滤器，包括Guava、Hutool和Redisson库的使用，以及在缓存穿透等场景的应用。

摘要由CSDN通过智能技术生成

什么是布隆过滤器

布隆过滤器（Bloom Filter）是1970年由布隆提出来的。它实际上是由一个很长的二进制数组+一系列hash算法映射函数，用于判断一个元素是否存在于集合中。
布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多，缺点是有一定的误识别率和删除困难。

场景

假设有10亿条手机号，然后判断某条手机号是否在列表内？

mysql可以吗？

正常情况下，如果数据量不大，我们可以考虑使用mysql存储。将所有数据存储到数据库，然后每次去库里查询判断是否存在。但是如果数据量太大，超过千万，mysql查询效率是很低的，特别消耗性能。

HashSet可以吗

我们可以把数据放入HashSet中，利用HashSet天然的去重性，查询只需要调用contains方法即可，但是hashset是存放在内存中的，数据量过大内存直接oom了。

布隆过滤器特点

插入和查询效率高，占用空间少，但是返回的结果是不确定的。
一个元素如果判断为存在的时候，它不一定真的存在。但是如果判断一个元素不存在，那么它一定是不存在的。
布隆过滤器可以添加元素，但是一定不能删除元素，会导致误判率增加。

布隆过滤器原理

布隆过滤器其实就是是一个BIT数组，通过一系列hash算法映射出对应的hash,然后将hash对应的数组下标位置改为1。查询时就是对数据在进行一系列hash算法得到下标，从BIT数组里取数据如如果是1 则说明数据有可能存在，如果是0 说明一定不存在

为什么会有误差率

我们知道布隆过滤器其实是对数据做hash,那么不管用什么算法，都有可能两条不同的数据生成的hash确是相同的，也就是我们常说的hash冲突。

首先插入一条数据：好好学技术

最低0.47元/天解锁文章

Java技术攻略

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java如何实现布隆过滤器

布隆过滤器（Bloom Filter）是1970年由布隆提出来的。它实际上是由一个很长的二进制数组+一系列hash算法映射函数，用于判断一个元素是否存在于集合中。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多，缺点是有一定的误识别率和删除困难。欢迎关注个人公众号【好好学技术】交流学习。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。