给定一个最多包含40亿个随机排列的32位整数的顺序文件,找出一个不在文件中的32位整数(在文件中至少缺少一个这样的数——为什么?)。在具有足够内存的情况下,如何解决该问题?如果有几个外部的“临时”文件可用,但是仅有几百字节的内存,又该如何解决该问题?
无处不在的二分搜索:
如果我的整数位于1到n之间,那么你可以再log(2)n次之内猜中。
如果n是1000,10次就可以完成。
如果n是100万,则最多20次就可以完成。
在程序设计中二分搜索最常见的应用是在有序数组中搜索元素。
如图:
查找数字50
二分法C代码:
#include<stdio.h>
#include<time.h>
int main()
{
int a[100000];
int n=80070;
int low=0,high=100000;
int mid=0;
for(int i=0;i<100000;i++)
{
a[i]=i;
}
int p=clock();
while(low<=high)
{
mid=(low+high)/2;
if(n<a[mid])
high=mid-1;
else if(n>a[mid])
low=mid+1;
else
{
printf("The number is at the position %d\n",mid+1);
break;
}
}
int q=clock();
printf("%d\n",q-p);
return 0;
}
为了便于与普通的顺序查找算法比较,特别加上顺序查找的C代码:
#include<stdio.h>
#include<time.h>
int main()
{
int a[100000];
int n=80070;
int low=0,high=100000;
int mid=0;
for(int i=0;i<100000;i++)
{
a[i]=i;
}
int p=clock();
for(int j=0;j<100000;j++)
{
if(a[j]==n)
printf("The number is at the position %d\n",j+1);
}
int q=clock();
printf("%d\n",q-p);
return 0;
}