归并排序遵循分治法的思想:将原问题分解为规模较小但类似于原问题的子问题,递归求解这些子问题,然后合并这些子问题的解来建立子问题的解。
分治模式每层递归时都有三个步骤:
- 分解原问题为若干子问题,这些子问题是原问题的规模较小的实例;
- 解决这些子问题,递归地求解各子问题。若子问题的规模足够小,则直接求解;
- 合并这些子问题的解成原问题的解。
归并排序算法完全遵循分治模式。其操作如下:
- 分解:分解待排序的 n 个元素的序列成各具 n/2 个元素的两个子序列;
- 解决:使用归并排序递归地排序两个子序列;
- 合并:合并两个已排序的子序列以产生已排序的答案。
当待排序的序列长度为1时,递归开始回归,回归到最上层,其结果即为最终结果。
归并排序的关键时合并两个已排序序列,通常通过一个辅助函数 Merge(A, p, q, r)来完成。其中 A 是数组,p、q、r 是数组下标,满足 p ≤ q ≤ r。子数组 A[ p,…,q ] 和 A[ q+1,…,r ] 都已经排好序。它合并这两个子数组形成一个已排好序的数组A[p,…,r]。
辅助函数 Merge 工作方式类似于扑克牌的例子,假设桌面上有两堆面朝上的牌,每推都已排序,需要将这两堆牌合并成一堆排好序的牌。基本思想是依次选择两堆牌堆上小的牌,将小的牌移至输出堆。
伪代码
其中每个堆底放置一张哨兵牌,其标志值为∞,避免每个步骤必须检查是否堆为空。
void merge(int * const a, int p, int q, int r)
{
const int n1 = q-p+1; // 左侧子数组长度
const int n2 = r-q; // 右侧子数组长度
int left[n1]; // copy 左侧子数组
int right[n2]; // copy 右侧子数组
//
for( int i = 0; i < n1; i++ )
left[i] = a[p+i];
for( int i = 0; i < n2; i++ )
right[i] = a[q+i+1];
int i = 0; // 左侧子数组游标
int j = 0; // 右侧子数组游标
int k = p; // a 数组游标
for( ; i != n1 && j != n2; k++)
{
if( left[i] <= right[j] )
{
a[k] = left[i];
i++;
}else {
a[k] = right[j];
j++;
}
}
if( i == n1 ) // 若左侧子数组所有元素完成排序
{
while( j != n2 )
{
a[k] = right[j];
k++;
j++;
}
}
if( j == n2 ) // 若右侧子数组所有元素完成排序
{
while( i != n1 )
{
a[k] = left[i];
k++;
i++;
}
}
}
void merge_sort(int * const a, int p, int r)
{
if( p < r)
{
int q = (r+p)/2;
merge_sort(a, p, q);
merge_sort(a, q+1, r);
merge(a, p, q, r);
}
}