归并排序不足之处
约翰.冯.诺伊曼
(John von Neumann)在1945年提出归并排序,其时间复杂度为(nlogn)
,但归并排序不是原地排序算法,空间复杂度比较高,是O(n)。所以托尼.霍尔
(Tony Hoare)在1961年提出快速排序,最差:O(n²),期望O(nlogn).另外,快速排序的内循环比大多数排序算法都要短小,这意味着它无论是在理论上还是在实际中都要快。它的主要缺点是非常脆弱,在实现时要非常小心才能避免低劣的性能。幸好有相应的解决方式,通过随机性算法来打乱数组,以避免最差的情况发生。
归并排序与快速排序算法思路比较
快排亦是基于一种分治的排序算法。快速排序和归并排序是互补的:归并排序将数组分成两个子数组分别排序,并将有序的子数组归并以将整个数组排序;而快速排序将数组排序的方式则是当两个子数组都有序时整个数组也就自然有序了。在第一种情况中,递归调用发生在处理整个数组之前;在第二种情况中,递归调用发生在处理整个数组之后。
数组划分原理
- 选取固定位置主元x(如尾元素)
- 维护两个部分的右端点变量i,j
- 考察数组元素A[j],
只和主元比较
- 把主元放在中间作分界线
若A[j]<=x,则交换A[j]和A[i+1],i,j右移
若A[j]>x,则j右移
过程态
初始态
结果态
把主元放在中间作分界线
数组划分:伪代码
/**
*Partition(A,p,r)
*输入:数组A,起始位置p,终止位置r
*输出:划分位置q
*/
x <-- A[r] //选取主元
i <-- p-1
for j <-- p to r - 1 do //时间复杂度为O(n)
if A[j] <=x then
exchange A[i + 1] with A[j]
i <-- i + 1
end
end
exchange A[i + 1] with A[r] //主元作分界线
q <-- i + 1
return q
快速排序:伪代码
/**
*QuickSort(A,p,r) 初始调用: QuickSort(A,1,n)
*输入:数组A,起始位置p,终止位置r
*输出: 有序数组A
*/
if p < r then
q <-- Partition(A,p,r) 最好情况O(n) 最坏情况O(n)
QuickSort(A,p,q-1) T(n / 2) T(0)
QuickSort(A,q+1,r) T(n / 2) T(n-1)
end
T(n) = 2T(n/2) + O(n) = O(nlogn)
T(n) = T(n-1) + T(0) + O(n) = O(n²)
随机划分考虑
反思最差情况
数组划分时选取固定位置主元,可以针对性构造最差情况
解决方案
数组划分时选取随机位置主元,无法针对性构造最差情况
Randomized-Partition(A,p,r)
//输入:数组A,起始位置p,终止位置r
//输出:划分位置q
s <-- Random(p