04 位图(Bit Map)

位图

位图可以节省存储空间。

public class BitMap { // Java 中 char 类型占 16bit,也即是 2 个字节
  private char[] bytes;
  private int nbits;
  
  public BitMap(int nbits) {
    this.nbits = nbits;
    this.bytes = new char[nbits/16+1];
  }

  public void set(int k) {
    if (k > nbits) return;
    int byteIndex = k / 16;
    int bitIndex = k % 16;
    bytes[byteIndex] |= (1 << bitIndex);
  }

  public boolean get(int k) {
    if (k > nbits) return false;
    int byteIndex = k / 16;
    int bitIndex = k % 16;
    return (bytes[byteIndex] & (1 << bitIndex)) != 0;
  }
}

将数字 A 的第 k 位设置为1:A = A | (1 << (k - 1))
将数字 A 的第 k 位设置为0:A = A & ~(1 << (k - 1))
检测数字 A 的第 k 位:A & (1 << (k - 1)) != 0
用于理解bitmap中代码

布隆过滤器

适用范围

布隆过滤器适用于不需要100%准确的,允许存在小规模判误的大规模判重场景。比如爬虫网站去重,比如统计大型网站每日UV数(用户访问数)。

原理

利用位图,以及多个hash函数。只能保证查找失败的确是没有,不能保证查找成功的是确实存在的。只会对存在的情况进行误判。bloom filter: False is always false. True is maybe true.
作者回复: 布隆过滤器本身就是解决位图消耗空间比较多的问题。位图的大小是数据的范围。而布隆过滤器的大小应该是小于位图大小的,所以肯定就是数据的范围了。

参照极客时间上:数据结构与算法之美课程做的笔记。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值