位图算法-速度之巅
问题:有很多不重复的整数, 其中最大值不超过40亿, 最小值是0.要求判断某个指定的整数, 是否在这个集合中,怎样才能以最快速度做出判断。
方法:位图算法
对于时间和空间来说是很难两全的,所以利用大的空间来让时间尽可能缩短。
1个字节代表8位。
使用2个字节,表示16个数(0-15)的状态(有或者没有)
如果数据为【5,1,7,15,0,4,6,10】,则存储状态为:
把存在的数标为1。
见代码👇
#include <stdio.h>
#include <Windows.h>
void init(char* data, int len) {
// 根据实际需求来实现.
// 这里只是为了测试后面的算法效果, 假设:
// 能够被3整数的数, 都在这个集合中.[假设的需求]
unsigned int n = len * 8; //一共有n个数据
for (unsigned int i = 0; i < n; i++) {
// 假设: 能够被3整数的数, 都在这个集合中.[假设的需求]
if (i % 3 == 0) {
//计算这个位对应哪个字节
char* p = data + i / 8;
*p = *p | (1 << (i % 8));
}
}
}
// 位图算法
bool check(char* data, int len, int value) {
// 定位到指定的字节
char* p = data + value / 8;
// 判断这个字节中指定的位是否为1
bool ret = *p & (1 << (value % 8));
return ret;//若为0则该位就为0;
}
int main(void) {
// 很配一块足够的内存, 用来表示位图
unsigned int n = 4000000000;
int len = n / 8 + 1;
char* data = (char*)malloc(len);
memset(data, 0, len); //全部初始化为0
// 装载数据集合(只需要装载一次)
init(data, len);
while (1) {
printf("请输入要检测的数: [输入-1退出] ");
int value;
scanf_s("%d", &value);
if (value == -1) {
break;
}
if (check(data, len, value)) {
printf("%d在数据集合中\n", value);
}else {
printf("%d不在数据集合中\n", value);
}
}
system("pause");
return 0;
}
总结:对于位图算法来说主要考察的是对于位运算的操作,利用位或(|)来对对应数进行标记(位或运算无论什么数和0位或(|)都等于原来的数和1位或都等于1),利用位与(&)来判断是否被标记过(只有两个都为1才为1)。