归并排序即其优化

一,概要

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并

二,基本思想:

首先给一个数组用(arr来表示):


下一步:将原数组分组,

     第一次分:5,2,7,4一组,8,1,6,3,一组


第二次分组:5,2,一组,7,4一组,8,1一组,6,3一组


第三次分组:每个数各为一组


第二步:开始归并

第一次归并:5,与2原来是一组的,所以5和2对比,其他依次进行


第二次归并:


第三次归并:


就以第三次归并来讲下归并的方法:

(经过第一,二次归并后,arr={2,4,5,7,1,3,6,8}),由于第一,二次不大好说,所以这里从第三次归并开始,

第三次归并后有两组:

第一组(也就是arr[0...3]表示):

第一组也就是arr[4...7]表示

第一步:定义一个临时数组,长度为这两组的长度之和,这里命令为temp[8],并将此时经过第一,二次归并得到的数组赋值给temp(即此时temp={2,4,5,7,1,3,6,8});

第二步:用两个变量来代表这两个分组数组的第一个元素,这里用i,j;,从i=0,j=mid+1=4;(mid=(7-0)/2开始,

第三步:开始比较两组,

1,第一组的第一个元素arr[i]=2,与第二组的第一个元素arr[j]=1,比较,1<2,所以1应该放在数组arr的第一个位置,arr[k]=temp[j],此时,k++,j++

2,继续比较,arr[i]=2与arr[j]=3,显然2<3;所以2放在数组arr的第二个位置arr[k]=temp[i],此时k++,i++;

3,arr[i]=4与arr[j]=3,显然3<4;所以3放在数组arr的第三个位置arr[k]=temp[j],此时k++,j++

4,arr[i]=4与arr[j]=6,显然4<6;所以4放在数组arr的第四个位置arr[k]=temp[i],此时k++,i++

5,arr[i]=5与arr[j]=6,显然5<6;所以5放在数组arr的第五个位置arr[k]=temp[i],此时k++,i++

6,arr[i]=7与arr[j]=6,显然6<7;所以6放在数组arr的第六个位置arr[k]=temp[j],此时k++,j++

7,arr[i]=7与arr[j]=8,显然7<8;所以7放在数组arr的第七个位置arr[k]=temp[i],此时k++,i++

此时i++>mid了(即已经遍历玩第一组了,那就直接arr[k]=temp[j]了);

到最后就可以完成排序了!(注意判断i,j是否合法)。


注意:上述是从第三次归并开始说的,可以观察到这两组已经是排好序的,当分组的时候一直往下分,到最后只有一个元素是一组,当然也就是有序的了,所以从最后一组开始归并,没完成一次,都会得到有序的分组,并在此基础上继续归并,这也验证了归并排序,是将已有序的子序列进行合并。

三,代码:
#include<iostream>
using namespace std;

//将arr[l....mid]和arr[mid+1....r]两部分进行归并
void __merge(int  arr[], int l, int mid, int r) {

	//复制数组
	int *temp = new int[r - l + 1];

	for (int i = l; i <= r; i++)
		temp[i - l] = arr[i];

	int i = l, j = mid + 1;

	for (int k = l; k <= r; k++) {
		if (i > mid) {
			//判断i是否有效
			arr[k] = temp[j - l];
			j++;
		}
		else if (j > r)
		{
			//判断j是否有效
			arr[k] = temp[i - l];
			i++;
		}
		else if (temp[i - l] < temp[j - l]) {
			arr[k] = temp[i - l];
			i++;
		}
		else {
			arr[k] = temp[j - l];
			j++;
		}
	}
}

void __mergesort(int arr[], int l, int r) {

	if (l >= r)
		return;

	int mid = (l + r) / 2;
	//分组
	__mergesort(arr, l, mid);
	__mergesort(arr, mid + 1, r);

	//归并
	__merge(arr, l, mid, r);

}


int main() {

	int arr[8] = { 5,2,7,4,8,1,6,3 };
	for (int i=0; i < 8; i++)
		cout << arr[i] << " ";
	__mergesort(arr, 0, 7);


	cout << endl;
	for (int i=0; i < 8; i++) 
		cout << arr[i] << " ";
	
	return 0;
}

结果:


四,优化:

假如有如下情况:


假设经过第一次归并后,发现2,4这与5,7这组应用是按顺序排好的了,那就没有必要再对2,4,5,7进行归并了,具体做法如下:

判断:arr[mid]<arr[mid+1],成立则就不用进行归并,反之则进行,比如对于2,4,5,7这组,mid=(3-0)/2=1;

    arr[mid]=4<arr[mid+1]=5;

代码:在上述代码的__mergesort中在进行归并前加上条件arr[mid]>arr[mid+1]。

void __mergesort(int arr[], int l, int r) {

	if (l >= r)
		return;

	int mid = (l + r) / 2;
	//分组
	__mergesort(arr, l, mid);
	__mergesort(arr, mid + 1, r);

	//优化
	if(arr[mid]>arr[mid+1])
	__merge(arr, l, mid, r);

}

优化之后的对比:

关于对比方法,点击去看看

这里用1000000数据量进行对比:

对比后结果:


其实差别也不大!

五,总结
归并排序是稳定排序,它也是一种十分高效的排序,能利用完全二叉树特性的排序一般性能都不会太差。java中Arrays.sort()采用了一种名为TimSort的排序算法,就是归并排序的优化版本。从上文的图中可看出,每次合并操作的平均时间复杂度为O(n),而完全二叉树的深度为|log2n|。总的平均时间复杂度为O(nlogn)。而且,归并排序的最好,最坏,平均时间复杂度均为O(nlogn)。

认真领悟!


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值