现在有n个无重复的正整数(n 小于10的7次方),如果内存限制在1.5M以内,要求对着n个数进行排序。【编程珠玑第一章题目】
很显然,10的7次方个整数占用的空间为10 ^ 7 * 4字节,大约等于40M,而内存限制为1.5M,因此,无法将所有数字加载到内存,所以快速排序、堆排序等高效的排序算法就没法使用。这里可以使用bitmap方式,用1bit表示一个整数,那么,10^7个整数需要10^7位,也就是大约1.25M空间。
如下是bitmap对无重复整数的排序过程。
一、一次bitmap就可以将所有数据排完
如果每个整数占一位,可以将所有的整数在内存中表示(如上述提到的那样),那么可以直接一次bitmap排序就完成了,时间复杂度为O(n),空间复杂度为O(n位)。下面分别给出C和C++的bitset方式:
1、C语言方式
下面代码以n = 100为例子;n是海量时,只要每个整数1bit可以一次在内存中表示所有整数的情况下,方法一样,将宏定义N的值改为海量数据的上限(比如10^7)即可:
//位图排序
#include <iostream>
#include <bitset>
#define WIDTHWORD 32 //一个整数的宽度是32bit
#define SHIFT 5
#define MASK 0x1F //0x1f == 31
#define N 100 //对十万个无重复的整数排序
using namespace std;
//申请一个N位的bitmap
int bitmap[1 + N / WIDTHWORD];
//将bitmap的第value设置为1
void set(int value) {
bitmap[value >> SHIFT] |= (1 << (value & MASK));
}
//清除bitmap第value位上的1:设置为0
void clear(int value) {
bitmap[value >> SHIFT] &= ~(1 << (value & MASK));
}
//测试bitmap第value位是否为1
int test(int value) {
return bitmap[value >> SHIFT] & (1 << (value &a