问题: 有很多不重复的整数,其中最大值不超过40亿,最小值是0,要求判断某个指定的整数,是否在这个集合中。
最快的算法:
使用位图算法
使用2个字节(一个字节八位),表示16个数(0-15)的状态(有或者没有)
如果数据为【5,1,7,15,0,4,6,10】,则存储状态为:
存在把对应的位数设为1,不存在设为0 ;
//位图算法
bool check(char* data, int len, int value) {
//定位到指定字节
char* p = data + value / 8;
// 判断这个字节中指定的位是否为1 与
bool ret = *p & (1 << (value % 8));
return ret;
}
void init(char* data, int len) {
//根据实际需求来定义实现
//这里只是为了测试后面的算法效果 假设:
//能够被3整除的数 都在这集合中
unsigned int n = len * 8;//一共有n个数据
for (unsigned int i = 0; i < n; i++) {
if (i % 3 == 0) {
//计算这个位对应哪个字节
char* p = data + i / 8;
*p = *p | (1 << (i % 8));//或操作
}
else {
}
}
}
int main(void) {
//分配一块足够的内存,用来表示位图
//计算多少个字节 40亿 个数
unsigned int n = 4000000000;
int len = n / 8 + 1;
char* data = (char*)malloc(len);
memset(data, 0, len);//清0
//装载数据 集合(只需要装载一次)
init(data,len);
while (1) {
printf("请输入要检查的数:[输入-1退出]");
int value;
scanf_s("%d", &value);
if (value == -1) {
break;
}
if (check(data, len, value)) {
printf("%d在数据集合中\n", &value);
}
else
{
printf("%d不在数据集合中\n", value);
}
}
system("pause");
return 0;
}