一、引入
生成初始归并段时,我们把含有 n 个记录的文件传入内存,按照给定的 内排序算法 或 置换-选择排序算法 划分成 m 个规模较小的有序的记录段。
内排序算法生成初始归并段的过程如下:
- 把含有 n 个记录的文件,按内存大小 w 分成若干长度为 w 的子文件(归并段);
- 分别将各子文件(归并段)调入内存,采用有效的内排序方法排序后送回外存。产生 n/w 个初始归并段。
我们可以看到,使用内排序算法时,由于需要将整个归并段调入内存,再使用内排序方法对其进行排序,所以归并段的大小必须不超过内存的大小 w ,这便限制了初始归并段的数量,初始归并段的数量过多影响到了外部排序算法的执行效率。因此,我们需要使用 “置换-选择排序算法” 对算法进行改进。
二、算法思想
选择内存缓冲区中的一个数,该数需要符合以下的条件:
- 该数必须大于当前初始归并段中任意数字
- 该数是符合条件1的可选数中最小的一个
如果符合上述条件,则将该数加入当前初始归