理解BloomFilter

最新推荐文章于 2020-12-11 00:07:30 发布

张申傲

最新推荐文章于 2020-12-11 00:07:30 发布

阅读量207

点赞数 1

分类专栏：架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34452850/article/details/93297110

版权

架构专栏收录该内容

15 篇文章 0 订阅

订阅专栏

理解BloomFilter

一. 产生背景

很多时候，我们都有这样一个需求：判断一个元素是否存在于集合中。比如IDEA中的单词拼写检查，要判断一个用户输入的单词是否在词库中。

我们轻易能想到的一个简单的解决方案，就是使用一个Hash表，将所有合法的单词都保存在Hash表中，这样写入和查询的时间复杂度都为O(1)，还是很快的。但是这样做有一个问题，就是太耗费空间。而且由于Hash表的散列冲突问题，就更加剧了空间的占用。这时就可以应用Bloom Filter。

二. BloomFilter原理

Bloom Filter有两个要素：

一个很长的二进制向量
一系列随机映射函数(hash函数)

布隆过滤器的原理是：当一个元素被加入集合时，通过K个hash函数将这个元素映射成一个位数组中的K个点，并把这K个点置为1。检索时，我们只要看看这些点是不是都是1就（大约）知道集合中有没有它了：如果这些点有任何一个0，则被检元素一定不在；如果都是1，则被检元素很可能在。这就是布隆过滤器的基本思想。

可以注意到，上面用了大约、很可能这些修饰词，也就是说，BloomFilter是有一定误判率的：

如果一个元素被判断为不存在，则一定不存在。
如果一个元素实际不存在，但是其映射到的K个位置都是1，则会将其误判为存在。

三. BloomFilter使用场景

垃圾邮件过滤
白名单
解决缓存穿透

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
理解BloomFilter

理解BloomFilter一. 产生背景很多时候，我们都有这样一个需求：判断一个元素是否存在于集合中。比如IDEA中的单词拼写检查，要判断一个用户输入的单词是否在词库中。我们轻易能想到的一个简单的解决方案，就是使用一个Hash表，将所有合法的单词都保存在Hash表中，这样写入和查询的时间复杂度都为O(1)，还是很快的。但是这样做有一个问题，就是太耗费空间。而且由于Hash表的散列冲突问题，就...
复制链接

扫一扫

专栏目录

博客等级

码龄8年

118
原创

225
点赞

387
收藏

99
粉丝

关注

私信

热门文章

分类专栏

MyBatis 设计思想 6篇
漫谈云原生 2篇
MySQL 5篇
日常总结 3篇
Java虚拟机原理 3篇
Java并发编程 13篇
Spring 22篇
ElasticSearch 5篇
ActiveMQ 6篇
RocketMQ 14篇
微服务 2篇
Netty 2篇
Kafka 2篇
redis 10篇
Zookeeper 2篇
缓存 3篇
架构 15篇

最新评论

MySQL索引详解
昔梦4: mylsam不是非聚集索引吗
基于DelayQueue实现的带失效时间的缓存
sp42a: 怎么 get 缓存啊
MyBatis预编译机制详解
fan_9833: 加不加单引号是由typeHandler决定的如果最后拿到的是IntegeTypeHandler是不会加单引号的
MyBatis预编译机制详解
fan_9833: mysql数字和字符串的比较是将字符串转为数字再进行比较的。如果查询时用字符串那么被转换的是SQL中的字符串，这样不会影响表索引。而如果查询时用的是数字，字段格式是字符串，意味着表中的数据格式需要转换，用字符串格式建立的索引是不匹配的，因此不使用索引，#{}会不会加单引号不确定，但是加了单引号不会影响索引使用是可以确定的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

张申傲 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。