首先介绍下归并方法。就是把两个已经有序的数组合并成一个更大的有序数组。
// stably merge a[lo .. mid] with a[mid+1 .. hi] using aux[lo .. hi]
public static void merge(Comparable[] a, Comparable[] aux, int lo, int mid, int hi) {
// precondition: a[lo .. mid] and a[mid+1 .. hi] are sorted subarrays
assert isSorted(a, lo, mid);
assert isSorted(a, mid+1, hi);
// copy to aux[]
for (int k = lo; k <= hi; k++) {
aux[k] = a[k];
}
// merge back to a[]
int i = lo, j = mid+1;
for (int k = lo; k <= hi; k++) {
if (i > mid) a[k] = aux[j++];
else if (j > hi) a[k] = aux[i++];
else if (less(aux[j], aux[i])) a[k] = aux[j++];
else a[k] = aux[i++];
}
// postcondition: a[lo .. hi] is sorted
assert isSorted(a, lo, hi);
}
注意下,在这个归并方法中,归并两个子数组的那个循环中,要判断是否其中一个子数组已经超过了尾界。针对这点有个改善的归并方法。在对辅助数组aux赋初始值时,把第二个子数组以非递增顺序赋给aux,然后对第二个子数组从后向前索引。也就是第一个子数组从第一个元素开始向后索引,第二个子数组从最后一个元素开始向前索引。这样可以避免对两个子数组的越界判断。
private static void merge(Comparable[] a, int lo, int mid, int hi) {
for (int i = lo; i <= mid; i++)
aux[i] = a[i];
for (int j = mid+1; j <= hi; j++)
aux[j] = a[hi-j+mid+1];
int i = lo, j = hi;
for (int k = lo; k <= hi; k++)
if (less(aux[j], aux[i])) a[k] = aux[j--];
else a[k] = aux[i++];
}
下面说说归并排序算法。一般有两类:自顶向下归并排序算法(Top-down mergesort)和自下向上归并排序算法(Bottom-up mergesort)。
自顶向下归并排序就是利用递归地对两个子数组调用归并排序,然后把排序好的两个子数组进行归并。
// mergesort a[lo..hi] using auxiliary array aux[lo..hi]
private static void sort(Comparable[] a, Comparable[] aux, int lo, int hi) {
if (hi <= lo) return;
int mid = lo + (hi - lo) / 2;
sort(a, aux, lo, mid);
sort(a, aux, mid + 1, hi);
merge(a, aux, lo, mid, hi);
}
自下向上归并排序是采用非递归方式实现的。它对数组从最小的规模(1)开始依次归并,如a[0]和a[1]归并,a[2]和a[3]归并,...;下一个循序归并的规模是上一次的两倍,如归并a[0~1]和a[2~3],...,归并a[4~5]和a[6~7],...
// bottom-up mergesort
public static void sort(Comparable[] a) {
int N = a.length;
Comparable[] aux = new Comparable[N];
for (int n = 1; n < N; n = n+n) {
for (int i = 0; i < N-n; i += n+n) {
int lo = i;
int m = i+n-1;
int hi = Math.min(i+n+n-1, N-1);
merge(a, aux, lo, m, hi);
}
}
assert isSorted(a);
}
最后讲讲归并排序算法的改进。可以从3个方面改进。
一、对规模比较小的数组采用简单的插入排序算法。
二、如果第二个子数组的第一个元素比第一个子数组最后一个元素还大的情况,说明整个数组已经有序了。终止程序。
三、省去对辅助数组的赋初始值的过程。但还是得用一个数组来存放最终排序号的数组,所以能省去一些时间但并不能省去必须的空间。
private static void merge(Comparable[] src, Comparable[] dst, int lo, int mid, int hi) {
// precondition: src[lo .. mid] and src[mid+1 .. hi] are sorted subarrays
assert isSorted(src, lo, mid);
assert isSorted(src, mid+1, hi);
int i = lo, j = mid+1;
for (int k = lo; k <= hi; k++) {
if (i > mid) dst[k] = src[j++];
else if (j > hi) dst[k] = src[i++];
else if (less(src[j], src[i])) dst[k] = src[j++]; // to ensure stability
else dst[k] = src[i++];
}
// postcondition: dst[lo .. hi] is sorted subarray
assert isSorted(dst, lo, hi);
}
private static void sort(Comparable[] src, Comparable[] dst, int lo, int hi) {
if (hi <= lo + CUTOFF) {
insertionSort(src, lo, hi);
return;
}
int mid = lo + (hi - lo) / 2;
sort(dst, src, lo, mid);
sort(dst, src, mid+1, hi);
/*
if (!less(dst[mid+1], dst[mid])) {
for (int i = lo; i <= hi; i++) src[i] = dst[i];
return;
}
*/
// a bit faster
if (!less(dst[mid+1], dst[mid])) {
System.arraycopy(dst, lo, src, lo, hi - lo + 1);
return;
}
merge(dst, src, lo, mid, hi);
}
索引归并排序算法。就是对待排序数组的索引进行排序,但不改变原数组。
/***********************************************************************
* Index mergesort
***********************************************************************/
// stably merge a[lo .. mid] with a[mid+1 .. hi] using aux[lo .. hi]
private static void merge(Comparable[] a, int[] index, int[] aux, int lo, int mid, int hi) {
// copy to aux[]
for (int k = lo; k <= hi; k++) {
aux[k] = index[k];
}
// merge back to a[]
int i = lo, j = mid+1;
for (int k = lo; k <= hi; k++) {
if (i > mid) index[k] = aux[j++];
else if (j > hi) index[k] = aux[i++];
else if (less(a[aux[j]], a[aux[i]])) index[k] = aux[j++];
else index[k] = aux[i++];
}
}
// return a permutation that gives the elements in a[] in ascending order
// do not change the original array a[]
public static int[] indexSort(Comparable[] a) {
int N = a.length;
int[] index = new int[N];
for (int i = 0; i < N; i++)
index[i] = i;
int[] aux = new int[N];
sort(a, index, aux, 0, N-1);
return index;
}
// mergesort a[lo..hi] using auxiliary array aux[lo..hi]
private static void sort(Comparable[] a, int[] index, int[] aux, int lo, int hi) {
if (hi <= lo) return;
int mid = lo + (hi - lo) / 2;
sort(a, index, aux, lo, mid);
sort(a, index, aux, mid + 1, hi);
merge(a, index, aux, lo, mid, hi);
}