布隆过滤器
追逐消失的记忆
这个作者很懒,什么都没留下…
展开
-
布隆过滤器
布隆过滤器(BloomFilter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。当年,布隆过滤器还是静态的,即只能处理一定容量的数据,不能处理未知规模的数据。1. 问题情景如果面试官问你,一个网站有 100 亿 url 存在...转载 2019-07-29 10:44:09 · 249 阅读 · 0 评论 -
简单布隆过滤器设计方案
假如有1亿个不重复的正整数(大致范围已知),但是只有1G的内存可用,如何判断该范围内的某个数是否出现在这1亿个数中?最常用的处理办法是利用位图,1*108/1024*1024*8=11.9,也只需要申请12M的内存。但是如果是1亿个邮件地址,如何确定某个邮件地址是否在这1亿个地址中?这个时候可能大家想到的最常用的办法就是利用Hash表了,但是大家可以细想一下,如果利用Hash表来处理,必须...转载 2019-07-29 11:21:31 · 690 阅读 · 2 评论