布隆过滤器 学习

本文内容

  1. 用处、特点、应用场景
  2. 原理
  3. 优缺点
  4. 改善

用处:测试一个元素是否在集合中

特点:

  • 常量级别空间、时间复杂度
  • 能告诉你某个元素 一定不存在 可能存在 于集合

应用场景:

  • 网络爬虫去除重复URL,一定未访问过的URL
  • 垃圾邮件地址
  • 缓存穿透,将可能存在的数据放入,过滤掉不存在数据

原理:

多哈希函数的映射,一个很长的二进制位表+多个哈希函数

  • 初始时位表全为0
  • 添加:多个哈希函数计算多个位置,将对应位置上位表置1
  • 查询:多个哈希函数计算多个位置,如果有一个位置为0,则元素肯定不存在,全为1,则可能存在

优点:

  • 常量级别的时间、空间复杂度
  • 不保存元素内容,安全
  • 哈希函数间独立,方便硬件并行执行

缺点:

  • 有一定概率误判
  • 删除困难

改善

基于想达到的误判率p、估计的元素数目n,按照公式计算长度m,哈希函数个数k

 

 

学习自

https://cloud.tencent.com/developer/article/1456844
https://zhuanlan.zhihu.com/p/43263751

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Redisson布隆过滤器是基于Redis实现的Java分布式布隆过滤器。它可以在多个JVM节点或其他进程中通过相同的KEY获取到布隆过滤器布隆过滤器的主要功能是判断某个元素是否存在于容器中,因此非常适合解决缓存穿透问题和检查数据是否重复的场景。使用Redisson布隆过滤器时,需要单独开一个定时任务来初始化布隆过滤器的数据,并在删除或更新数据时重新刷新布隆过滤器。虽然使用布隆过滤器可能稍显麻烦,但可以使用Redis的Set类型来替代。\[1\]\[2\] 在代码示例中,可以看到使用Redisson布隆过滤器的示例代码。首先通过redisson.getBloomFilter方法获取布隆过滤器实例,然后使用tryInit方法初始化布隆过滤器的容量和误差率。接下来可以使用add方法向布隆过滤器中添加元素,使用contains方法判断元素是否存在于布隆过滤器中。\[2\]\[3\] 总结来说,Redisson布隆过滤器是一种解决缓存穿透和检查数据重复的有效工具,但在使用时需要注意初始化和刷新布隆过滤器的操作。 #### 引用[.reference_title] - *1* *2* *3* [从头开始学Redisson--------布隆过滤器](https://blog.csdn.net/yanluandai1985/article/details/104848454)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值