位图算法的核心思想:用连续排列的内存字节bit位来代表连续的数据,用bit位的o和1状态来代表该数据是否出现。用内存空间来查找换取速度。
位图算法的主要用途:大量数据的查询场景
如图使用一个字节来表示0-7的8个数,其中0、2、3、5、7出现。
问题:有很多不重复的数据,最大值不超过40亿,最小值为0。判断某个整数是否在这个数列中。
原理图:
代码:
#include <iostream>
using namespace std;
void setMum(char* addr, int len);
bool comp(char* addr, int len, int value);
int main() {
unsigned int num = 4000000000; // 40亿,int32最大正值2147483647,所以用无符号的
// 计算出数据占用字节数
int len = num / 8 + 1; // 如果len出现奇数,需要加1才能全部存储
unsigned int value = 0;
char* addr = (char* )malloc(len); // 申请堆区内存
memset(addr, 0 , len); // 堆区内存初始化0
setMum(addr, len);
while (1) {
cout << "请输入数据[-1结束]:";
cin >> value;
if (value == -1) {
return 0;
}
if (comp(addr, len, value)) {
cout << value << "在数据中" << endl;
}
else cout << value << "不在数据中" << endl;
}
return 0;
}
// 模拟需求存入所有能被3整除数
void setMum(char* addr, int len) {
char* p = NULL;
unsigned int n = len * 8; // 算出最大数,用来遍历
//unsigned int n = len * 8;
for(unsigned int i = 0; i <= n; i++ ) { // i <= len*8这是不行,C++默认的整形是int类型,这里会溢出
// 3整除判断
if (i % 3 == 0) {
p = addr + i / 8; // 地址偏移
*p = *p | (1 << (i % 8)); // 某位置1:先算出某位位1的值(1左移n位),然后或运算
}
}
}
// 判断输入的数是否存在
bool comp(char* addr, int len, int value) {
bool ret;
char* p = NULL;
p = addr + value / 8; // 找到某个数据所在的内存地址
ret = *p & (1 << (value % 8));
return ret;
}
输入、输出:
请输入数据[-1结束]:0
0在数据中
请输入数据[-1结束]:2
2不在数据中
请输入数据[-1结束]:3
3在数据中
请输入数据[-1结束]:6
6在数据中
请输入数据[-1结束]:10000000
10000000不在数据中
请输入数据[-1结束]:10000001
10000001不在数据中
请输入数据[-1结束]:10000002
10000002在数据中
请输入数据[-1结束]:-1