位图法是《编程珠玑》第一章中出现的磁盘排序算法。
题目:一个最多包含n个正整数的文件,每个数都小于n,其中n=10^7,且所有正整数都不重复。求如何将这n个正整数升序排列。
约束:最多有1MB的内存空间可用,有充足的磁盘存储空间。
分析:这个题目的最大亮点是只有1MB的内存空间,我们可以通过计算得出,内存只有1MB可以储存的int(4byte)有10^3*10^3/4=250 000个号码。而包含正整数的文件约为10^7个int大小。这意味着无法将所有文件中的正整数一次读取进入到内存空间中去进行排序算法。因此衍生出下面两种方法:
方法1(多通道法):
题目中的限制为所有正整数都不重复。这代表:
输入文件中范围在1~249 999的正整数至多只有250 000个,至多占内存为1MB。
输入文件中范围在250 000~499 999的正整数至多只有250 000个,至多占内存问1MB。
…..
多通道方法:
- 第1遍遍历文件,将文件中范围在1~ 249 999的正整数读取进入1MB内存,排序(可以使用各种排序方法),将排序后的正整数存储在磁盘文件temp中<