布隆过滤器实战【防止缓存击穿】

最新推荐文章于 2024-03-03 21:31:31 发布

IT技术精选文摘

最新推荐文章于 2024-03-03 21:31:31 发布

阅读量211

点赞数

文章标签： java python 数据库 ajax mysql

原文链接：https://mp.weixin.qq.com/s?__biz=MzU1MjEyNjc0OQ==&mid=2247493710&idx=1&sn=aa62d358680e8ff2fd887ad8beba61dd&chksm=fb84783cccf3f12a9ef94be1063a615c7e1f9040f0cdd2fb4340b373e6ae8613b9d8b2fbdc88&scene=126&&sessionid=0

版权

若有收获,请记得分享和转发哦

这是我们小群的聊天记录，鸡蛋回家后就一直感冒没好，之前都是我和他还有歪歪密切接触，一起吃饭啥的，所以我们都很慌。

今天他复查没问题，我们也如释重负，明天我也回杭了，大家下次大保健还是不要学鸡蛋不做保护措施，记得戴口罩。

为什么引入

我们的业务中经常会遇到穿库的问题，通常可以通过缓存解决。如果数据维度比较多，结果数据集合比较大时，缓存的效果就不明显了。因此为了解决穿库的问题，我们引入Bloom Filter。

适合的场景

数据库防止穿库 Google Bigtable，Apache HBase和Apache Cassandra以及Postgresql 使用BloomFilter来减少不存在的行或列的磁盘查找。避免代价高昂的磁盘查找会大大提高数据库查询操作的性能。如同一开始的业务场景。如果数据量较大，不方便放在缓存中。需要对请求做拦截防止穿库。
缓存宕机缓存宕机的场景，使用布隆过滤器会造成一定程度的误判。原因是除了Bloom Filter 本身有误判率，宕机之前的缓存不一定能覆盖到所有DB中的数据，当宕机后用户请求了一个以前从未请求的数据，这个时候就会产生误判。当然，缓存宕机时使用布隆过滤器作为应急的方式，这种情况应该也是可以忍受的。
WEB拦截器相同请求拦截防止被攻击。用户第一次请求，将请求参数放入BloomFilter中，当第二次请求时，先判断请求参数是否被BloomFilter命中。可以提高缓存命中率
恶意地址检测 chrome 浏览器检查是否是恶意地址。首先针对本地BloomFilter检查任何URL，并且仅当BloomFilter返回肯定结果时才对所执行的URL进行全面检查（并且用户警告，如果它也返回肯定结果）。
比特币加速 bitcoin 使用BloomFilter来加速钱包同步。

开源项目地址：https://github.com/luw2007/bloomfilter

我们先看看一般业务缓存流程：

Rottenstreich，Kanizo和Keslassy（2012）引入了一种基于变量增量的新通用方法，该方法显着提高了计算布隆过滤器及其变体的误报概率，同时仍支持删除。与计数布隆过滤器不同，在每个元素插入时，散列计数器以散列变量增量而不是单位增量递增。要查询元素，需要考虑计数器的确切值，而不仅仅是它们的正面性。如果由计数器值表示的总和不能由查询元素的相应变量增量组成，则可以将否定答案返回给查询。

IT技术精选文摘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
布隆过滤器实战【防止缓存击穿】

若有收获,请记得分享和转发哦这是我们小群的聊天记录，鸡蛋回家后就一直感冒没好，之前都是我和他还有歪歪密切接触，一起吃饭啥的，所以我们都很慌。今天他复查没问题，我们也如释重负，明天我也回杭了...
复制链接

扫一扫