【数据结构】深入浅出理解快速排序背后的原理以及版本优化【万字详解】（C语言实现）

本文链接：https://blog.csdn.net/NiNi_suanfa/article/details/134195831

快速排序

快速排序递归实现
前言
一、Hoare版本
（一）算法运行图例
（二）算法核心思路
（三）算法实现步骤
- （1）单趟
- （2）多趟
（四）码源详解递归实现
- （1）Hoare版本：先行版
- （2）Hoare版本：发行版
（五）Hoare算法实现背后的理论支持
（六）效率优化
- Hoare排序的效率分析
- （1）时间复杂度 O（N*logN）
- 稳定性：不稳定
（七）代码优化
（1）三数取中
- 1）优化思路
2）三数取中优化后的代码
- 3）效果对比
（2）小区间优化—— 小区间不再进行递归分割排序，降低递归次数
- 1）优化思路
2）整体优化后的完整代码
二、挖坑法版本
前言
（一）算法运行图例
（二）算法核心思路
（三）算法实现步骤
- （1）单趟
- （2）多趟
（四）码源详解
三、前后指针版本
（一）算法运行图例
（二）算法核心思路
（三）算法实现步骤
- （1）单趟
- （2）多趟
（四）码源详解

快速排序递归实现

前言

快速排序是Hoare于1962年提出的一种 二叉树结构的交换排序方法。

一、Hoare版本

（一）算法运行图例

在这里插入图片描述

（二）算法核心思路

任取待排序元素序列中的某元素作为基准值，按照该排序码将待排序集合 分割成两子序列 ，左子序列中所有元素均小于基准值，右子序列中所有元素均大于基准值，然后最左右子序列重复该过程，直到所有元素都排列在相应位置上为止。

（三）算法实现步骤

（1）单趟

找一key 【注意：我们实际上控制的是key的下标keyi，而不是用新开辟的变量去储存它的值，用新开辟的变量去储存，最后交换的也只是与该变量进行交换，而不是在数组中与原数组的值进行交换】
【图讲解】
begin从左开始遍历，左边找比key大的。end从右开始遍历，右边找比key小的。等于key的值不动。
两边都找到了，互换
最后相遇的地方（就是key排好序后要放的位置（正确的位置））与key互换【有理论支持的，请看下文】

此时【左边的都比key小】中间key【右边的都比key大】
要是左右要是都有序 =》整体实现有序（多趟解决）

（2）多趟

对排好的key的左边再进行单趟排序
对排好的key的右边再进行单趟排序
左边右边分别再排好两边key的位置，再分左右，再进行单趟

类似 二叉树前序递归的思想：根、左子树、右子树。

（四）码源详解递归实现

（1）Hoare版本：先行版

按照思路写出来了，大家看看都存在些什么问题。

//递归实现
// Hoare版本（先行版）
int PartSort1(DataType* a,int left,int right) {

	int key = a[left];          
	 
	while (left < right) {     //相遇是跳出循环的条件     //right 先走
		if (a[key] < a[right]) {      
			right--;          
		}                                              //找到a[right]<a[keyi]的情况就停下

		if (a[left] < a[key]) {      //left 同理
			left++;
		}

		
		Swap(&a[left], &a[right]);       //都找到后互换
	}

	Swap(&a[left], &a[key]);//相遇后跳出循环 交换a[keyi]和left,right相遇的位置
}

坑1：a[key] < a[right]，若a[key] 一直比 a[right]要小，则right则回一直向左right–遍历，则会出现越界的问题（同理left那边也是）
- 解决方法：left<right,控制right不要越界，避免该序列本来就是有序（一直比a[keyi]要大而一直right–，越出边界的情况）的情况

坑2：a[keyi] < a[right]，若不跳则要是两边都遇到相等的值，则两边无法再进入if（）语句进行right–或left++，而进入死循环
- 解决方法：a[keyi]<=a[right]时，都跳
坑3：int key = a[left]; Swap(&a[left], &a[key]); 真正在换的是哪个？
key是局部变量，相当于在栈区开辟了一块空间，用于存储a[left]的值。实际与数组a[left]进行交换的，是局部变量这块空间里面的值，对数组原始的最左边并不产生任何影响
- 解决方法：int left = keyi; 记录的应该是下标，通过控制下标来达到改变原数组

（2）Hoare版本：发行版

// Hoare版本（发行版）
int PartSort1(DataType* a, int left, int right) {

	int keyi = left;          //保存left的下标

	while (left < right) {     //相遇是跳出循环的条件     //right 先走
		if (left < right && a[keyi] <= a[right]) {      //left<right,控制right不要越界，避免该序列本来就是有序（一直比a[keyi]要大而一直right--，越出边界的情况）的情况
			right--;
		}                                              //找到a[right]<a[keyi]的情况就停下

		if (left < right && a[left] <= a[keyi]) {      //left 同理
			left++;
		}


		Swap(&a[left], &a[right]);       //都找到后互换
	}

	Swap(&a[left], &a[keyi]);//相遇后跳出循环 交换a[keyi]和left,right相遇的位置
}

（五）Hoare算法实现背后的理论支持

★☆ 最后相遇的地方就是key排好序后要放的位置（正确的位置）是怎么做到的呢？
右边先走做到的。
在这里插入图片描述

有了上面的理论保证，停下来的值一定比key小，才敢进行交换。

（六）效率优化

Hoare排序的效率分析

（1）时间复杂度 O（N*logN）

如果每次选到的 key=a[ left ] 都是中位数，这将会非常高效
【因为每单趟排好一次，key就能落入到其正确的位置】

理想状态下是：满二叉树的分割【二分 O（N*logN）】
而最差的情况：有序（接近有序）【每次取到的key都选到整个数组中次大或次小的数，每个key，left或right都要遍历一遍数组， O（N^2）】但随机取的值肯定不是像这样有序（或接近有序）的（这种都是已经给你排好了的）

在这里插入图片描述

所以总体来说，Hoare在时间复杂度上是更接近于 O（N*logN） 的。

稳定性：不稳定

（七）代码优化

（1）三数取中

那么我们针对序列可能会出现最差情况（有序的情况），做一个程序优化——三数取中。

1）优化思路

int mid=（left+right）/ 2 ；
对比 a[mid]、a[left]、a[right] 三个值，取值大小为中间的那个数。【大大降低了取两边极端的可能，让取到的数更偏向于有序序列中间的数】

//三数取中 取的不是位置在中间的值，而是值大小位于中间的值
int Getmidi(DataType* a,int left,int right) {
	int mid = (left + right) / 2;
	
	//left mid right
	if (a[left] < a[mid]) {
		if (a[mid] < a[right])       //mid为中间值
			return mid;
		else if (a[left] > a[right]) {    //mid为最大值
			return left;                  //left为中间值
		}
		else {
			return right;
		}
	}
	else { //a[left]>a[mid]
		if (a[mid] > a[right]) {         //mid为中间值
			return mid;
	    }
		else if (a[left]<a[right]) {     //left为中间值，mid最小
			return left;
		}
		else {
			return right;
		}
	}

}

2）三数取中优化后的代码

//三数取中 取的不是位置在中间的值，而是值大小位于中间的值
int Getmidi(DataType* a,int left,int right) {
	int mid = (left + right) / 2;
	
	//left mid right
	if (a[left] < a[mid]) {
		if (a[mid] < a[right])       //mid为中间值
			return mid;
		else if (a[left] > a[right]) {    //mid为最大值
			return left;                  //left为中间值
		}
		else {
			return right;
		}
	}
	else { //a[left]>a[mid]
		if (a[mid] > a[right]) {         //mid为中间值
			return mid;
	    }
		else if (a[left]<a[right]) {     //left为中间值，mid最小
			return left;
		}
		else {
			return right;
		}
	}

}


// Hoare版本（发行版）
int PartSort1(DataType* a, int left, int right) {
	//三数取中
	int midi = Getmidi(a, left, right);
	Swap(&a[left], &a[midi]);   //交换a[left]与a[midi]值的位置     

	int keyi = left;          //保存left的下标

	while (left < right) {     //相遇是跳出循环的条件     //right 先走
		if (left < right && a[keyi] <= a[right]) {      //left<right,控制right不要越界，避免该序列本来就是有序（一直比a[keyi]要大而一直right--，越出边界的情况）的情况
			right--;
		}                                              //找到a[right]<a[keyi]的情况就停下

		if (left < right && a[left] <= a[keyi]) {      //left 同理
			left++;
		}

		//坑1：a[keyi] < a[right]，若不跳则要是两边都遇到相等的值，则两边无法再进入if（）语句进行right--或left++，而进入死循环
		//更正：a[keyi]<=a[right]时，都跳

		Swap(&a[left], &a[right]);       //都找到后互换
	}

	Swap(&a[left], &a[keyi]);//相遇后跳出循环 交换a[keyi]和left,right相遇的位置
}

3）效果对比

对有序/接近有序的序列中优化效果明显。
对随机就正常。
在这里插入图片描述

（2）小区间优化—— 小区间不再进行递归分割排序，降低递归次数

1）优化思路

满二叉树整体节点的个数：2^h-1（ 等比数列求和）。
最后一层的节点数就已经占了整体的 50% 。
最后三层的节点数就已经约占整体的 80% 的节点个数了。

那么最后这三层约占整体80%的节点数，若采用递归的方式，将是对栈帧的一个很大的开销。因为我们最后这三层区间被分的比较小了，若采用更适用于小区间数排序的优化，无疑是对效率很大的提升！

那么小区间优化我们可以选择哪个小区间数排序方式呢？
希尔排序：数据大时比较有序（目的：让大的数更快的到后面去）
插入排序：少的数（最坏情况：逆序，比所有数都小）

因为小区间，数比较少，对比起来比较快，所以这里选择插入排序更快速便捷高效。
在这里插入图片描述

//小区间优化版本—— 小区间不再进行递归分割排序，降低递归次数
void QuickSort1(DataType* a, int begin, int end) {
	if (begin >= end)
		return;

	//10个数就已经占3层递归了，而递归层数中，尾三层所占节点的总数 约占80%，这尾三层再继续用递归的方法，而改用小区间数据排序优化的思路，能让程序整体得到进一步的优化
	if ((end - begin + 1) > 10) {
		int keyi = PartSort3(a, begin, end);
		QuickSort1(a, begin, keyi - 1);
		QuickSort1(a, keyi+1, end);
	}
	else {      //改用小区间数据优化排序
		InsertSort(a + begin, end - begin + 1);    // a+begin 找到对应数组所在的位置
	}
}

2）整体优化后的完整代码

//三数取中 取的不是位置在中间的值，而是值大小位于中间的值
int Getmidi(DataType* a,int left,int right) {
	int mid = (left + right) / 2;
	
	//left mid right
	if (a[left] < a[mid]) {
		if (a[mid] < a[right])       //mid为中间值
			return mid;
		else if (a[left] > a[right]) {    //mid为最大值
			return left;                  //left为中间值
		}
		else {
			return right;
		}
	}
	else { //a[left]>a[mid]
		if (a[mid] > a[right]) {         //mid为中间值
			return mid;
	    }
		else if (a[left]<a[right]) {     //left为中间值，mid最小
			return left;
		}
		else {
			return right;
		}
	}

}



// Hoare版本（发行版）
int PartSort1(DataType* a, int left, int right) {
	//三数取中
	int midi = Getmidi(a, left, right);
	Swap(&a[left], &a[midi]);   //交换a[left]与a[midi]值的位置     

	int keyi = left;          //保存left的下标

	while (left < right) {     //相遇是跳出循环的条件     //right 先走
		if (left < right && a[keyi] <= a[right]) {      //left<right,控制right不要越界，避免该序列本来就是有序（一直比a[keyi]要大而一直right--，越出边界的情况）的情况
			right--;
		}                                              //找到a[right]<a[keyi]的情况就停下

		if (left < right && a[left] <= a[keyi]) {      //left 同理
			left++;
		}

		//坑1：a[keyi] < a[right]，若不跳则要是两边都遇到相等的值，则两边无法再进入if（）语句进行right--或left++，而进入死循环
		//更正：a[keyi]<=a[right]时，都跳

		Swap(&a[left], &a[right]);       //都找到后互换
	}

	Swap(&a[left], &a[keyi]);//相遇后跳出循环 交换a[keyi]和left,right相遇的位置
}



//小区间优化版本—— 小区间不再进行递归分割排序，降低递归次数
void QuickSort1(DataType* a, int begin, int end) {
	if (begin >= end)
		return;

	//10个数就已经占3层递归了，而递归层数中，尾三层所占节点的总数 约占80%，这尾三层再继续用递归的方法，而改用小区间数据排序优化的思路，能让程序整体得到进一步的优化
	if ((end - begin + 1) > 10) {
		int keyi = PartSort3(a, begin, end);
		QuickSort1(a, begin, keyi - 1);
		QuickSort1(a, keyi+1, end);
	}
	else {      //改用小区间数据优化排序
		InsertSort(a + begin, end - begin + 1);    // a+begin 找到对应数组所在的位置
	}
}

二、挖坑法版本

前言

挖坑法是Hoare排序的一个思路上的优化：不用再考虑为什么右边先走。
因为一开始的坑就在左边，那么一开始就得先从右边开始找，找比坑小的数。

（一）算法运行图例

在这里插入图片描述

（二）算法核心思路

和Hoare的思路一样，只不过这里是先挖好一个坑，再开始排。如果在左边挖坑，则从右边开始找；如果在右边挖坑，则从左边开始找。

（三）算法实现步骤

（1）单趟

int key = a[left]; //保存好key值以后,左边形成第一个坑
右边先走，找小，填到左边的坑，右边形成新的坑
左边再走，找大，填到右边的坑，左边形成新的坑位
left、right 相遇，跳出循环。最终相遇，一定在坑上相遇（因为left、right其中一个必在坑位上）且该坑位就是key值该在的有序序列中正确的位置（和Hoare版本的同理）。将key保留的最开始坑位的值赋给现在left、right相遇所在的坑位。

（2）多趟

对排好的key的左边再进行单趟排序
对排好的key的右边再进行单趟排序
左边右边分别再排好两边key的位置，再分左右，再进行单趟

（四）码源详解

// 快速排序——挖坑法
int PartSort2(int* a, int left, int right) {
	//三数取中——取位值位于中间的值
	int midi = Getmidi(a, left, right);
	Swap(&a[left], &a[midi]);
    
	int key = a[left];      //保存好key值以后,左边形成第一个坑
	int hole = left; 

	//单趟完成的返回的条件
	while (left < right) {
    
    //右边先走，找小，填到左边的坑，右边形成新的坑
    while (left < right && key <= a[right]) {
		right--;
	}
	a[hole] = a[right];
	hole = right;

	//左边再走，找大，填到右边的坑，左边形成新的坑位
	while (left < right && a[left] <= key) {
		left++;
	}
	a[hole] = a[left];
	hole = left;

	}
	
	//最后把储存的key的值填入坑位，不用怕坑位的数被覆盖，因为原坑位的数在这之前就已经赋到其他地方了
	a[hole] = key;
	return hole;      //返回已经排好正确位置的坑位位置

}

三、前后指针版本

（一）算法运行图例

在这里插入图片描述

（二）算法核心思路

cur一直向前遍历，不管是遇到大的还是遇到小的。

而prev遇小的向前++，把小的交换过来；遇到大的就停下，等遇到小的时候就++将其交换覆盖。旨在把小的放其左边，大的放其右边。

cur越界后，遍历结束。此时 prev 所在的地方，正是key值该在的有序序列中正确的地方。

（三）算法实现步骤

（1）单趟

三数取中 _ 取中间值赋给key
int prev = left ; int cur = prev + 1;
cur遇比key小的，交换Swap(&a[++prev],&a[cur]);（把小的放其左边）
cur越界，遍历结束
Swap ( &a[prev],&a[keyi] ); 此时 prev 所在的地方，正是key值该在的有序序列中正确的地方。

（2）多趟

对排好的key的左边再进行单趟排序
对排好的key的右边再进行单趟排序
左边右边分别再排好两边key的位置，再分左右，再进行单趟

（四）码源详解

先行版
这样写存在什么问题？

// 快速排序前后指针法 —— 先行版
int PartSort3(int* a, int left, int right) {
	int midi = Getmidi(a, left, right);
	Swap(&a[left], &a[midi]);

	int prev = left;
	int cur = prev + 1;

	int keyi = left;
	while (cur <= right) {     //cur越界结束
		while (cur <= right && a[cur] > a[keyi]) {      //没有碰到比key小的就一直向后遍历
			cur++;
		}

		//找到了
		++prev;                                         //遇小的了就++prev，Swap(&a[prev], &a[cur]);交换
		Swap(&a[prev], &a[cur]);
	}

	//cur越界后，代表遍历结束
	//在a[++prev] 的位置将key值赋予它（key该在的正确位置）
	Swap(&a[prev], &a[keyi]);
	return prev;
}

当cur一直没有再遇到小的，cur将会越界，而这仅会跳出内层（cur向后遍历）的循环，但程序仍在外层交换的循环中走。

所以cur越界后，程序仍要向下运行代码，这时交换的不再是数组中的数值，而是数组外后一位cur越界后位置的数值。
在这里插入图片描述

所以应不再进行交换。交换已经结束了。应跳出外层交换 a[prev] 和 a[cur] 的循环。进行下一步 a[prev] 与 a[keyi] 的交换，交换到key在有序中的正确位置。

发行版（一）
当判断出cur越界，即可break跳出循环，不再进行 a[prev] 与 a[cur] 的交换

// 快速排序前后指针法 —— 先行版
int PartSort3(int* a, int left, int right) {
	int midi = Getmidi(a, left, right);
	Swap(&a[left], &a[midi]);

	int prev = left;
	int cur = prev + 1;

	int keyi = left;
	while (cur <= right) {     //cur越界结束
		while (cur <= right && a[cur] > a[keyi]) {      //没有碰到比key小的就一直向后遍历
			cur++;
		}

		if (cur > right) {     //当判断出cur越界，即可break跳出循环，不再进行 a[prev] 与 a[cur] 的交换
			break;
		}

		//找到了
		++prev;                                         //遇小的了就++prev，Swap(&a[prev], &a[cur]);交换
		Swap(&a[prev], &a[cur]);
	}

	//cur越界后，代表遍历结束
	//在a[++prev] 的位置将key值赋予它（key该在的正确位置）
	Swap(&a[prev], &a[keyi]);
	return prev;
}

发行版（二）

// 快速排序前后指针法
int PartSort3(int* a, int left, int right) {
	int midi = Getmidi(a, left, right);
	Swap(&a[left], &a[midi]);

	int prev = left;
	int cur = prev + 1;

	int keyi = left;
	while (cur <= right) {     //cur越界结束
		
		//写法一
		if (a[cur] < a[keyi]) {            
			Swap(&a[++prev],&a[cur]);    //在还没遇到大的之前，cur = prev + 1; a[++prev] = a[cur];数组自己与自己交换
			                             //遇小交换的意义：将比其小的值放左边，比其大的值放右边
		}

        //写法二
		if (a[cur] < a[keyi] && ++prev != cur); {    //如果不想要自己与自己交换的这种不必要的交换，++prev != cur条件也可以这么写
			Swap(&a[prev], &a[cur]);
 	}
		
		cur++;
	}

	//cur越界后，代表遍历结束
	//在a[prev] 的位置将key值赋予它（key该在的正确位置）
	Swap(&a[prev],&a[keyi]); 
	return prev;
}