template<typename T>
void __merge(T arr[], int l, int mid, int r){
T aux[r-l+1]; //aux数组是arr[]的一个副本,arr[]由来盛放最终的整体排序数组
for( int i = l ; i <= r; i ++ )
aux[i-l] = arr[i];
int i = l, j = mid+1; // i在[L,mid]区间中,j在[mid+1,R]区间中
for( int k = l ; k <= r; k ++ ){
if( i > mid ) //当i>mid时,左半部分已经全部进入归并的整体数组中,剩下的右半部分就可以直接放归并的整体数组中了。(左右半部分进行归并时左右半部分已经有序了)
{
arr[k] = aux[j-l];
j ++;
}
else if( j > r ) //当j>r时,右半部分已经全部进入归并的整体数组中,剩下的左半部分就可以直接放归并的整体数组中了。(左右半部分进行归并时左右半部分已经有序了)
{
arr[k] = aux[i-l];
i ++;
}
else if( aux[i-l] < aux[j-l] )
{
arr[k] = aux[i-l];
i ++;
}
else
{
arr[k] = aux[j-l];
j ++;
}
}
}
// 递归使用归并排序,对arr[l...r]的范围进行排序
template<typename T>
void __mergeSort(T arr[], int l, int r){
if( l >= r ) //递归将区间二分,当分到只有一个元素的时候直接就是有序的了,可直接返回。
return;
int mid = (l-r)/2+r; //(l+r)/2 这里有一个隐患哦!
__mergeSort(arr, l, mid);
__mergeSort(arr, mid+1, r);
__merge(arr, l, mid, r); //当左右两部分都归并好后,就可对两部分进行整体合并(__merge()函数合并左右两部分)
}
template<typename T>
void mergeSort(T arr[], int n){
__mergeSort( arr , 0 , n-1 );//[0,n-1]区间
}
这里用到了3个函数:mergeSort()---->__mergeSort()---->__merge(), ---->代表函数调用,其中__mergeSort()和__merge()分别负责:区间的划分和区间的合并。
当然,上述的算法还是可以进行优化的部分。
对于__mergeSort()函数来说,其优化部分在于最后一部分:“ __merge(arr, l, mid, r); ” 可以加上一个if判断语句,当左右部分在未合并的时候就已经整体有序的话,就已经不需要再调用__merge(arr, l, mid, r)函数了就可以直接return返回上一层了(递归中的上一层)
// 对于arr[mid] <= arr[mid+1]的情况,不进行merge
// 对于近乎有序的数组非常有效,但是对于一般情况,有一定的性能损失
if( arr[mid] > arr[mid+1] )
__merge(arr, l, mid, r);
优化后的测试中对于5万个随机数据组成的数组进行排序。比较:插入排序、归并排序。
自低向上的归并排序(不再需要递归):
for( int sz = 1; sz <= n ; sz += sz )//sz的大小代表左右归并部分的区间长度
for( int i = 0 ; i+sz < n ; i += sz+sz )//i代表归并区间的左端点,i+2*sz-1代表归并区间的右端点,i+sz<n,保证了右区间的存在,当只有左区间的时候就不需要进行调用__merge()了,就已经是有序的了
if( arr[i+sz-1] > arr[i+sz] )
__merge(arr, i, i+sz-1, min(i+sz+sz-1,n-1) );// 对 arr[i...i+sz-1] 和 arr[i+sz...i+2*sz-1] 进行归并
__merge()函数与递归版本的归并排序相同。__merge(arr[],int L,int mid,int R)