位图

位图

方法介绍

什么是位图

所谓的位图(Bit-map)就是用一个 bit 位来标记某个元素对应的 Value, 而 Key 即是该元素。由于采用了 Bit 为单位来存储数据,因此在存储空间方面,可以大大节省。

位图通过使用 bit 数组来表示某些元素是否存在,可进行数据的快速查找、判重、删除,一般来说数据范围是 int 的 10 倍以下。

来看一个具体的例子。假设我们要对 0-7 内的 5 个元素 (4,7,2,5,3)排序( 这里假设这些元素没有重复)。那么我们就可以采用位图的方法来达到排序的目的。要表示 8 个数,就只需要 8 个 bit(等于 1 字节),首先我们开辟 1 字节 的空间,将这些空间的所有 bit 位都置为 0 ,如图 6-6:
在这里插入图片描述

图 6-6然后遍历这 5 个元素, 首先第一个元素是 4,那么就把 4 对应的位置为 1( 可以这样操作 p + (i/8) | (001<< (i % 8)) 当然 , 这里的操作涉及到 Big-ending 和 Little-ending 的情况,这里默认为 Big-ending),因为是从 0 开始的,所以要把第五个位置为一, 如图 6-7:
在这里插入图片描述

图 6-7然后再处理第二个元素 7,将第八个位置为 1, ,接着再处理第三个元素,一直到最后处理完所有的元素,将相应的位置为 1,这时候的内存的 bit 位的状态,如图 6-8:

在这里插入图片描述

问题实例

  1. 电话号码的统计

    已知某个文件内包含一些电话号码,每个号码为 8 位数字,统计不同号码的个数。8 位最多 99 999 999,
    大概需要 99m 个 bit,大概十几兆字节的内存即可。

  2. 2.5 亿个数的去重
    在 2.5 亿个整数中找出不重复的整数,注,内存不足以容纳这 2.5 亿个整数
    分析:采用 2-Bitmap(每个数分配 2bit,00 表示不存在,01 表示出现一次,10 表示多次,11 无意义)
    进行,共需内存 2^32 * 2 bit=1 GB 内存,还可以接受。然后扫描这 2.5 亿个整数,查看 Bitmap 中相对应位,
    如果是 00 变 01,01 变 10,10 保持不变。所描完事后,查看 bitmap,把对应位是 01 的整数输出即可。
    也可采用与第 1 题类似的方法,进行划分小文件的方法。然后在小文件中找出不重复的整数,并排序。
    然后再进行归并,注意去除重复的元素。”

  3. 整数的快速查询
    给 40 亿个不重复的 unsigned int 的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在
    那 40 亿个数当中?
    分析:可以用位图/Bitmap 的方法,申请 512M 的内存,一个 bit 位代表一个 unsigned int 值。读入 40
    亿个数,设置相应的 bit 位,读入要查询的数,查看相应 bit 位是否为 1,为 1 表示存在,为 0 表示不存在。·

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值