布隆过滤器

lan_jianwen

已于 2023-07-28 17:03:55 修改

阅读量31

点赞数

分类专栏：易筋经文章标签：算法

于 2023-07-18 16:10:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lan_jianwen/article/details/131787612

版权

易筋经专栏收录该内容

4 篇文章 0 订阅

订阅专栏

什么是布隆过滤器

布隆过滤器由位图和多个哈希函数构成，解决类似黑名单问题。必定会存在误差率

原理

对字符串作哈希，得到多个哈希值，再将每个哈希值对位图大小m取余，得到索引位置标志为1。
如果一个字符串得到的所有哈希值对m取余后都命中1，则该字符串被命中。只要有一个命中0，则不算该字符串命中。

在这里插入图片描述

解析

误差率p：一个不属于黑名单中的数据命中了黑名单(宁错杀，不放过)
样本量n：实验的样本大小
哈希函数个数k：实验需要的哈希函数数量

公式

样本量固定，确定误差率，可以确定m的小

m越大，哈希值对m取余后分布越散列，即命中的概率越小，失误率就低；反之亦然。

m的大小为2，对m取余后只有0、1两个结果，命中几率就大，误差率就大
m的大小为10，对m取余后有0～9是个结果，命中几率小，误差率小

确定m大小，样本量大小，得到哈希个数

误差率随着哈希函数个数增加，先是下降到一定值又上升

k为1时，如果哈希冲突就命中，则误差率大
k为10亿时，哈希函数过多造成位图全部覆盖，此时必命中，误差率变大

位图大小和哈希函数个数确定，可以算出真正的误差率

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
布隆过滤器

布隆过滤器由位图和多个哈希函数构成，解决类似黑名单问题。必定会存在误差率。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。