<<编程珠玑>>第一章中需要编写一个排序程序,排序的对象是电话号码,每条电话记录都是7为整数,一共一千万条,号码都不重复。
该程序只有1MB的内存可用,而且排序时间最多几分钟,十秒钟为理想情况。
在32位操作系统下,如果用32位整数在表示每个号码,那么1MB可以存储250000个号码,可以进行40趟来完成。
这是一种方法,只是进行40趟所需时间较长,而问题的核心是是否能找到一种方法用八百万个可用位来表示一千万个整数,下面介绍位图排序。
位图排序
位图:将数据做成数字模型来储存
eg:可以用一个20位长的字符串来表示一个0-20的整数集合
例如{1,2,3,5,8,13}可以用字符串011101001000010000000来表示
代码实现:
#include <iostream>
using namespace std;
#define BITSPERWORD 32
#define SHIFT 5
#define MASK 0x1F
#define N 10000000
int a[N / BITSPERWORD];
void set(unsigned int i) //设置元素
{
a[i >> SHIFT] |= (1 << (i&MASK));
}
void clr(unsigned int i) //清除元素
{
a[i >> SHIFT] &= ~(1 << (i&MASK));
}
int test(unsigned int i) //测试元素
{
return a[i >> SHIFT] & (1 << (i&MASK));
}
int main(int argc, char** argv)
{
int i;
for (int i=0; i < N; i++) //先将每一位都置为0
{
clr(i);
}
while (cin >> i)
set(i); //添加元素
for (i = 0; i < N; i++)
{
if (test(i)) //输出
cout << i << " ";
}
return 0;
}
位图排序是用空间来节省时间的算法,时间复杂度为O(n)。
用位图排序可以用1MB来存储八百万个号码,因为没有0和1开头的电话号码,所以满足条件