问题:
给定输入文件,文件中每条记录是一个整型数(不重复),每条记录最大为n,n<=10000000,要求对文件中所有记录排序(从小到大),然后输入到给定文件。
限制:主存不超过1MB(实际程序超过了1M)。
按照《编程珠玑》上介绍,有以下几种方法:
1,多通道分片读取文件,然后合并排序分片文件
2,位图排序:适合于对大量不重复数据,并且数据其他相关数据。
算法描述如下:
示例:对于不超过20的整型数据,可以用20个bit位来表示,例如1,2,4,14可表示:
00000010000000001011,即将每一个数对应的bit位置1。
因此,对于10000000个记录项,可以用10000000个bit位来表示。
在设置或清除每一个读取的整数对应的位时:
(1)首先找到该整数对应的数组的下标(i>>5)。由于数组中的每一个整数有32位(假设int型为32位),这32位可以表示32个整数。
(2)找到该整数在对应整数的位坐标pos。
(3)设置或清除该整数的位。
c++实现如下:
c语言实现如下:
在我的机器上测试两种语言实现的效率:测试的数据位100000,c++用时为c语言的约两倍。