何时使用 Bloom filter,何时使用 BitMap?

参考:

何时使用布隆过滤器:如果您有一个集合(唯一条目列表)和一个哈希函数,则可以创建一个布隆过滤器。它允许“条目 x 是否可能在集合中?”类型的查询。如果条目在集合中,查询将肯定返回 true。对于不在集合中的条目,它可能会返回 true,但概率较低,通常为 1% 或更低(取决于布隆过滤器的大小)。您可以根据需要将布隆过滤器做得尽可能小,但对于大约 1% 的误报率,您需要每个条目大约 10 位。有使用更少空间的替代算法/数据结构,例如参见https://github.com/FastFilter。顺便说一下,布隆过滤器内部使用位数组。

何时使用位数组(也称为位集):如果条目是 0..n 之间的数字,则可以按如下方式使用位数组:为每个条目设置位 x。这将需要 n 位(无论有多少条目)。因此,如果您的条目可以是大数字,那么就会出现一个问题:它将使用大量内存。但是,您可以创建一个稀疏位数组(也称为压缩位数组),例如使用https://roaringbitmap.org/。与布隆过滤器不同,您不会出现误报,但大小使用在很大程度上取决于您的数据(取决于您拥有的数字),与布隆过滤器相比,这种依赖性要大得多。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ystraw_ah

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值