快速排序浅析

Arandot

已于 2022-12-08 00:10:05 修改

阅读量157

点赞数 4

分类专栏：算法基础文章标签： python c++

于 2022-11-24 12:23:46 首次发布

本文链接：https://blog.csdn.net/Arandot/article/details/128005690

版权

算法基础专栏收录该内容

4 篇文章 0 订阅

订阅专栏

快速排序及其边界问题浅析

快速排序是一种采用分治思想的排序方法，在大部分时候拥有相当高的效率。下面介绍其思路，并给出几个常用代码模板和边界问题分析。

快速排序的思想

快速排序是一种采用分治思想的排序方法。在每一步递归当中，它会选中一枚元素作为 $p i v o t$ （主元）。对于当前在递归栈中被操作的数组范围内的所有数，小于等于 $p i v o t$ 的元素都将分布在此范围左侧，大于等于 $p i v o t$ 的数组都将分布在此范围右侧。随后对左右两个区间再次重复操作。

$basic\ case$ : 范围内没有数或者只有一个数，此时结束递归。

快速排序模板、算法正确性及边界问题

来自闫总的两个模板：
I.

void quick_sort(int q[], int l, int r){
	if (l >= r){return;}
	int pivot = q[(r + l) >> 1] //>>是右移运算符，相当于/2但是比前者比后者快（因为前者直接对位进行操作）
	//-1 and +1 because the first and the last element need to be checked.
	int a = l - 1, b = r + 1;
	while (a < b){
		do {a++;}while(q[a] < pivot);
		do {b--}while(q[b] > pivot);
		/* a might be greater than or equal to b when the two loops above end.
		 So the check is a must.
		 Otherwise, q[b] would be less than the pivot and q[a] would be greater than the pivot*/  
		if (a < b) {swap(q[a], q[b])}
		// it is okay if you write (a <= b).
	}
	quick_sort(q, l, b), quick_sort(q, b + 1, r);
}

（1）此算法并不会卡在 $(q[b])\not=pivot$ 的情况不动，因为每次都是先加1或减1再判断（ $do\ while的好处$ ）。但是写成 $q[a](q[b])\ge(\le)pivot$ 会寄——举个例子，假设元素全相等，然后还 $> 0$ ，指针 $a$ 就会疯狂往后跑。

（2）使用循环不变式证明算法正确性：
待证明问题：当每次最外层 $w h i l e$ 一轮循环结束时， $(q[1..a]\le x)\land(q[b..r]\ge x) )$

初始化：在循环开始之前， $a=l-1,\ b=r+1$ ，不变式显然成立。

保持：若一轮循环开始前不变式成立，执行循环：

		//这个循环保证q[l..a - 1] < pivot, q[a] >= pivot.
		do {a++;}while(q[a] < pivot);
		//这个循环保证q[b + 1..r] > pivot, q[b] <= pivot.
		do {b--}while(q[b] > pivot);
		if (a < b) {swap(q[a], q[b])}

$case\ 1$ : 若在两次内部循环之后，有 $a < b$ ，则通过 $s w a p (q [a], q [b])$ ，有 $(q[1..a]\le pivot)\land (q[b..r])\ge pivot)$ ,保持循环不变式

$case\ 2$ : 若 $\ge b$ ，则 $i f$ 语句不会执行（此时对应最后一轮循环），此时有:

$\begin{cases} q[1..a - 1]< pivot \cr q[b + 1..r]> pivot \cr q[b] \le pivot \cr q[a] \ge pivot \end{cases}$

显然在这个情况下，只要 $q [a] > p i v o t$ 或者 $q [b] < p i v o t$ ,循环不变式就不再保持了。故对于最后一轮循环，其开始之前循环不变式成立，但其结束之后循环不变式可能不再保持。

终止：虽然说循环不变式可能只持续到倒数第二轮循环结束，但是其依旧能“为我们提供一个有用的性质，且该性质有助于证明该算法是正确的”。证明如下：
$\land (a \ge b)$ $\Rarr$ $q [1 . . b - 1] < p i v o t$ ,
$\le pivot$ $\Rarr$ $q[1..b]\le pivot \ \square$

（3）不能写成quick_sort(q, l, b - 1), quick_sort(q, b, r)! 一方面，这是因为可能 $q [b] < p i v o t$ ，不满足递归条件。另一方面，若 $p i v o t$ 取到了 $q [l]$ （注意，即使pivot写成 $q [(l + r) > > 1]$ 也是有可能取到的，比方说当范围内只有两个数的情况下就会取到）且之后的数全面小于 $q [l]$ ，则 $b$ 会一直走到 $l$ 停下，造成0/n划分从而无限循环。

（4） $p i v o t$ 不能取 $q [r]$ 。e.g.若之前的所有数都小于 $q [r]$ ，则会造成 $b = r$ ，从而造成无限循环。

（4）以上这种模板绝不会造成0/n划分，因为 $b$ 的取值范围是 $[l, r - 1]$ ，证明如下：
若最终 $b < l$ , 则由 $\le b$ 有 $a < l$ ，但经过第一轮循环（必定会发生）有 $\ge l$ ，矛盾！故 $b\ge l$ ；
若最终 $\ge r$ ，又最终 $\le r$ ，故而 $b = r$ .故在这个情况下整个过程只经过一次外部循环。
终止时 $\ge b$ ；考虑 $a$ 的上界，当数组中除了 $p i v o t$ 本身以外所有数都小于 $p i v o t$ 时， $a$ 可取到上界 $r$ ，可见 $\ge a$ ，而终止时 $\ge b$ ,则 $a = b = r$ 。
故 $q [l . . r - 1] < p i v o t$ ，这与 $p i v o t = q [(l + r) > > 1]$ 矛盾。(对于任意非 $basic\ case$ 的递归，有 $\dfrac{l+r}{2} <r$ )
故 $b\le r-1$ , 从而 $b\in [l, r-1]\ \square$

II.

void quick_sort(int q[], int l, int r){
	if (l >= r){return;}
	int pivot = q[(l + r + 1) >> 1]
	int a = l - 1, b = r + 1;
	while (a < b){
		do {a++} while(q[a] < pivot);
		do {b--} while(q[b] > pivot);
		if (a < b){swap(q[a], q[b];}
	}
	quick_sort(q, l, a - 1), quick_sort(q, a, r);
}

这是用 $a$ 做边界的模板。
（1）注意 $p i v o t$ 处是向上取整¹，因为向下取整会取到 $q [l]$ ，从而无限循环。
（2）不能写成quick_sort(q, l, a), quick_sort(q, a + 1, r);分析同上一个模板。

III. 一种没那么多比事的模板：

def quick_sort2(userinput: list, left_index: int, right_index: int):
    if left_index >= right_index:
        return None
    pivot = userinput[left_index]
    # define a pointer.
    swap = left_index
    for i in range(left_index + 1, right_index + 1):
        if userinput[i] <= pivot:
            swap += 1
            userinput[swap], userinput[i] = userinput[i], userinput[swap]
    userinput[swap], userinput[left_index] = userinput[left_index], userinput[swap]
    quick_sort2(userinput, left_index, swap - 1)
    quick_sort2(userinput, swap + 1, right_index)

这是一种单向循环实现的快速排序，在有些时候会效率低下（e.g. 数组从第二个开始严格递减）。其优点是指针并不会交错，边界处的问题非常清晰。

一点证明：
$\begin{cases} \lceil \dfrac{n}{k} \rceil= \lfloor \dfrac{n-1}{k}\rfloor +1 \cr \lfloor x\rfloor +n= \lfloor x+n \rfloor \end{cases}$ 取 $\Rarr \lceil \dfrac{l+r}{2}\rceil=\lfloor\dfrac{l+r+1}{2}\rfloor$ ↩︎