【布隆过滤器-原理】

布隆过滤器通过哈希函数将元素映射到位数组的过程如下:

一、选择合适的哈希函数

  1. 哈希函数的特性

    • 布隆过滤器通常使用多个不同的哈希函数。这些哈希函数应具有良好的随机性和均匀性,能够将不同的元素尽可能均匀地映射到不同的位置。
    • 例如,可以使用常见的哈希算法如 MD5、SHA-1 等,或者使用专门为布隆过滤器设计的哈希函数。
  2. 哈希函数的数量

    • 哈希函数的数量会影响布隆过滤器的性能和误判率。一般来说,哈希函数的数量越多,误判率越低,但同时也会增加计算成本和内存占用。
    • 通常可以根据预期的元素数量和期望的误判率来确定合适的哈希函数数量。

二、映射过程

  1. 计算哈希值

    • 当要将一个元素映射到位数组时,首先将元素作为输入传递给每个哈希函数,计算出相应的哈希值。
    • 例如,如果使用 MD5 作为哈希函数,将元素的字节数组作为输入传递给 MD5 算法,得到一个 128 位的哈希值。
  2. 确定位位置

    • 得到哈希值后,需要将其转换为位数组中的位置。这可以通过对哈希值进行取模操作来实现,即将哈希值对位数组的大小取模。
    • 例如,如果位数组的大小为 1000,哈希值为 12345,那么对应的位位置为 12345 % 1000 = 45。
  3. 设置位值

    • 确定了位位置后,将该位置的位设置为 1,表示该元素可能存在于集合中。
    • 如果该位置的位已经为 1,则不需要进行任何操作。

三、示例说明

假设我们有一个布隆过滤器,位数组的大小为 10,使用三个哈希函数(hash1、hash2、hash3)。现在要将元素“apple”映射到位数组中。

  1. 计算哈希值

    • 假设 hash1(“apple”) = 15,hash2(“apple”) = 27,hash3(“apple”) = 38。
  2. 确定位位置

    • 对位数组的大小取模,得到对应的位位置。例如,15 % 10 = 5,27 % 10 = 7,38 % 10 = 8。
  3. 设置位值

    • 将位数组中位置为 5、7、8 的位设置为 1。

如果要判断元素“banana”是否可能在集合中,同样计算其哈希值,确定位位置,然后检查这些位置的位是否都为 1。如果都为 1,则“banana”可能在集合中;如果有任何一个位置的位为 0,则“banana”一定不在集合中。

需要注意的是,布隆过滤器存在误判的可能性。即使一个元素对应的所有位都为 1,也不能确定该元素一定在集合中,只是存在较高的可能性。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

越来越亮

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值