布谷鸟过滤器与布隆过滤器学习笔记

布谷鸟过滤器与布隆过滤器

布谷(鸟)过滤器原理

写的比较详细易理解的博客来源:https://www.cnblogs.com/chuxiuhong/p/8215719.html

优点:

  1. 布谷过滤器在错误率小于3%的时候空间性能是优于布隆过滤器的
  2. 布谷过滤器在查找的时候可以确保两次访存就可以做完,相比于布隆过滤器的K个Hash函数K次访存,在数据量很大不能全部装载在内存中的情况下,多一次访存那么时间上就输了。

缺点:
当装填因子较高的时候,容易出现循环的问题,即插入失败的情况。

跟布隆过滤器共有的一个缺点:就是访问空间地址不连续,通常可以认为是随机的。

布隆过滤器

唯一看懂的解释布隆过滤器的博客:
https://www.cnblogs.com/cpselvis/p/6265825.html
布隆过滤器查询元素

  1. 将要查询的元素给k个哈希函数
  2. 得到对应于位数组上的k个位置
  3. 如果k个位置有一个为0,则肯定不在集合中
  4. 如果k个位置全部为1,则可能在集合中

二者对比

【分布式】Bloom Filter 与 Cuckoo Filter

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
布隆过滤器布谷鸟过滤器都是常见的数据结构,用于快速判断一个元素是否存在于一个集合中。它们在不同的应用场景下有不同的特点和适用性。 布隆过滤器是一种空间效率很高的概率型数据结构,它通过使用多个哈希函数和一个位数组来判断元素是否存在。当一个元素被加入集合时,分别对该元素进行多次哈希映射,并将对应的位数组位置置为1。当判断一个元素是否存在时,同样进行多次哈希映射,并检查对应的位数组位置是否都为1。如果有任意一位为0,则可以确定该元素一定不存在;如果都为1,则该元素可能存在(存在一定的误判概率)。 布谷鸟过滤器是一种更加高级的数据结构,它通过使用散列函数和一个数组来判断元素是否存在,并且可以支持插入和删除操作。布谷鸟过滤器使用散列函数将元素映射到数组的位置,如果该位置为空,则可以确定该元素一定不存在;如果该位置不为空,则需要进一步检查是否与目标元素相等。当插入新元素时,如果目标位置已经被占用,则需要重新散列冲突的元素,使其找到新的空位置。布谷鸟过滤器通过这种方式来解决布隆过滤器存在的误判问题。 总的来说,布隆过滤器适用于需要快速判断一个元素是否存在,且对存在一定的误判概率可以接受的场景。而布谷鸟过滤器则更加灵活,支持插入和删除操作,并且对误判有一定的容忍度。根据具体的需求和场景,选择适合的过滤器可以提高效率和准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值