一、归并排序的过程
归并排序也是分治思想,归并排序是指将两个已经排序的序列合并成一个序列的操作。具体思想如下图:
二、代码
package wsz;
import java.util.Arrays;
import javax.sound.midi.MidiChannel;
public class TestMergeSort {
/**
* 对start1 到 end1的一个有序数列,和start2到end2的一个有序数列进行归并
* 步骤:1.申请一个等于这两个数列的数组
* 2.交替进行比较如图片,将小的依次放入
* 3.将多出来的部分装进临时数组
* 4.将临时数组中的数据覆盖原数组中相应位置的数据
* @param array
* @param start1
* @param end1
* @param start2
* @param end2
*/
public static void merge(int []array, int start1, int end1, int start2, int end2) {
int i = start1; //第一个子序列的游标
int j = start2; //第二个子序列的游标
int k = 0;
int temp[] = new int[end2-start1+1];//等于两个序列长度之和的临时数组
while (i <= end1 && j <= end2) { //通过循环,依次将较小的值放入临时数组
if(array[i] < array[j])
temp[k++] = array[i++];
else
temp[k++] = array[j++];
}
//当上面的循环有一个已经移动到尽头(j已经移动到尽头),将剩下的一个序列中的数据放入临时的数组中
while(i <= end1)
temp[k++] = array[i++];
while(j <= end2)
temp[k++] = array[j++];
k = start1;
for (int element:temp) {//将临时数组中的数据覆盖原数组中相应位置的数据,可以理解为将临时数组放入原数组
array[k++] = element;
}
}
public static void mergeSort(int array[], int start, int end) {
if(start < end){
int mid = (start+end)/2;
mergeSort(array, start, mid);//左边递归分解
mergeSort(array, mid+1, end);//右边递归分解
merge(array, start, mid, mid+1, end);//对两个有序的子序列进行归并
System.out.println(Arrays.toString(array));
}
}
public static void main(String[] args) {
int array[] = {51, 46, 20, 18, 65, 97, 82, 30, 77, 50};
int i;
mergeSort(array, 0, array.length - 1);
System.out.println("排序结果:" + Arrays.toString(array));
}
}
代码执行过程如下图:
三、时间复杂度
归并排序是稳定排序,它也是一种十分高效的排序,能利用完全二叉树特性的排序一般性能都不会太差。java中Arrays.sort()采用了一种名为TimSort的排序算法,就是归并排序的优化版本。从上文的图中可看出,每次合并操作的平均时间复杂度为O(n),而完全二叉树的深度为|log2n|。总的平均时间复杂度为O(nlogn)。而且,归并排序的最好,最坏,平均时间复杂度均为O(nlogn)。发现merge函数中有if (a[i] < a[j]) 的语句,说明它需要两两比较,不存在跳跃,因此归并排序是一种稳定的排序算法。 也就是说,归并排序是一种比较占内存,但却效率高且稳定的算法。
(1)稳定性
归并排序是一种稳定的排序。
(2)存储结构要求
可用顺序存储结构。也易于在链表上实现。
(3)时间复杂度
对长度为n的文件,需进行趟二路归并,每趟归并的时间为O(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。
(4)空间复杂度
需要一个辅助向量来暂存两有序子文件归并的结果,故其辅助空间复杂度为O(n),显然它不是就地排序。
注意:
若用单链表做存储结构,很容易给出就地的归并排序
仅仅记住时间复杂度就行,可以不看如下的具体分析。
可以说合并排序是比较复杂的排序,特别是对于不了解分治法基本思想的同学来说可能难以理解。总时间=分解时间+解决问题时间+合并时间。分解时间就是把一个待排序序列分解成两序列,时间为一常数,时间复杂度o(1).解决问题时间是两个递归式,把一个规模为n的问题分成两个规模分别为n/2的子问题,时间为2T(n/2).合并时间复杂度为o(n)。总时间T(n)=2T(n/2)+o(n).这个递归式可以用递归树来解,其解是o(nlogn).此外在最坏、最佳、平均情况下归并排序时间复杂度均为o(nlogn).从合并过程中可以看出合并排序稳定。
用递归树的方法解递归式T(n)=2T(n/2)+o(n):假设解决最后的子问题用时为常数c,则对于n个待排序记录来说整个问题的规模为cn。
从这个递归树可以看出,第一层时间代价为cn,第二层时间代价为cn/2+cn/2=cn.....每一层代价都是cn,总共有logn+1层。所以总的时间代价为cn*(logn+1).时间复杂度是o(nlogn).