快速排序,最坏情况运行时间O(n^2), 平均运行时间O(nlogn),常数因子极小,原地排序,即便在虚拟内存条件下也能运行得很好。
快速排序采用了D&C(Divide and Couquer, 分治法)的设计思想:
Divide:将待排序的数组a[p, … , r]分解为两部分a[p, … , s-1]和a[s+1, … , r], 使得a[p, … , s-1]中的每个元素<=a[s], a[s+1, … , r]中的每个元素>=a[s],并在这个过程中得到s的值,注意这里的s不是事先选定的。
Conquer:将前一步分好的两部分数组递归的进行Quicksort。
Combine:因为子数组是原地排好序的,所以对于Combine这个过程不用过什么工作。
根据以上的思想,可以写出快排的代码如下:
其中,核心的步骤是partition。在下面实现中,partiton的过程把待partition的数组分成了3部分:在每次循环之前和循环之后(j++之前),a[..., i]是<=pivot的元素,a[i+1,...,j-1]是>=x的元素,这两部分都是分好了的,还有a[j,...]是待排序的元素。记住了这一点,这个算法就很好理解。
其Java代码如下所示:
对于上面的算法,有一种最坏的情况是,待排序的数组是已经有序的,这时候,因为作为pivot的数是最后一个元素,这导致每次分组的结果都是a[begin,…, end-1],另一部分为空,这时的运行时间就是最坏的O(n^2),为了避免这种情况,可以在实现的过程中加入随机化的思想。
要实现随机化,也有两种方法,一是在排序之前,将待排序的数组进行一次随机排列,再对数组进行排序。此外,还有一种更好的方法,那就是从待排序的数组中随机的选择一个数来作为pivot,再进行partition。这里的第2种方法用的是随机采样的思想(Random Sampling)。
Java代码如下:
其中的核心依然是partition(在这里,是randomizedPartition):
上面的实现的巧妙的地方有两处,一是前面提到过的随机采样的思想,其次是它没有重新实现partiton的过程,而是将得到的随机数与a[end]进行交换,这样,就可以重用前面的partition(a, begin, end)函数了。