BitMap
什么是bitmap
bitmap
就是用给一个bit位来标记某个元素对应的value
. 而key
就是这个元素.由于采用了
bit为单位
才存储数据. 因此可以大大节约空间.在32位的机器上. 一个整形,如int a,在内存中占有32位.可以用对应32个bit的表示十进制的0-31个数.
- bitmap算法利用这种思想处理大量数据的排序与查询.
优点
- 效率高.不需进行比较和移位.
- 占用内存少.
缺点
- 无法存在重复元素
算法
- 思想比较简单,关键是十进制和二进制bit位需要一个map映射表,把10进制映射到bit位上.
map映射表
假设需要排序或者查找的总数为N.
则需要申请的内存空间为 int arr[N/32+1].
其中a[0]在内存占32位
arr[0] : 0-31
arr[1] : 32-63
arr[2] : 64-95
…
如何用位移将十进制转换成对应的bit位
先求出 十进制 0-N 对应的在数组arr 中的索引.
index_loc= N/32
如 n=76.则 index_loc=76/32 =2. 因此 76在arr[2]中.
求出十进制数0-N对应的bit数.
bit_loc = N%32
如 n=76.则bit_loc=76%32=12.
利用移位0-31使得对应的32bit位为1
编码实现
#pragma once
#include "myinclude.h"
class bitmap {
private:
int *arr;
static const int SHIFT = 5;
static const int MASK = 0x1f;
public:
bitmap(int N = 100000) {
arr = new int[N /32+1]; // 开辟空间
// 初始化arr[]所有bit位为0
for (int i = 0; i < N / 32 + 1; i++) {
arr[i] &= 0;
}
}
// 添加n 设置所在的bit位为1
void add(int n) {
int index_loc = n >> SHIFT; // 相当于 n/32;
int bit_loc = n&MASK; // 相当于 n%32;
arr[index_loc] |= 1<<bit_loc;
}
// 测试n所在的bit位是否为1
bool check(int n) {
int index_loc = n >> SHIFT; // 相当于 n/32;
int bit_loc = n&MASK; // 相当于 n%32;
return arr[index_loc] & (1 << bit_loc);
}
};
int main(){
bitmap bm(100000);
for (int i = 333; i < 666; i++) {
bm.add(i);
}
srand(time(NULL));
for (int i = 0; i < 10; i++) {
int tmp = rand()%1000;
if (bm.check(tmp)) {
cout << tmp << " exist !" << endl;
}
}
system("pause");
return 0;
}