一 快速排序随机化
在快速排序(一)中提到,尽管快速排序的最差时间复杂度是θ(n^2),但是其平均时间复杂度是θ(nlgn),在文末的测试中也反映了这一点。但是作出这一判断的前提是,我们认为输入数组的所有排列都是等概率的。但是这一假设并非往往都成立。
考虑一个已经是按照升序排序的数组作为快速排序的输入数组,则排序中每一次划分都会将元素划分成元素个数分别为n-1和0的两个数组,如此一来,如果用快速排序算法进行元素排序,则其时间复杂度将会是θ(n^2)。而如果在某种应用场景的情况下,所有的待排序输入都是这种已经排序或者近似已排序的数组,则利用快速排序算法进行排序的平均时间复杂度也会是θ(n^2)。
在《算法导论》一书的习题中就提到过一个这样的场景:银行会按照交易时间来记录账户的交易情况,但是客户收到银行对账单时却希望能够按照支票号码的顺序来排列,这就需要银行按照支票号对原本的交易记录进行重新排列。这实际上是对大量近似有序的数组元素进行重排列。因此在这种应用场景的情况下如果用原始的快速排序算法,其耗时甚至比插入排序都更差。
我们可以通过一种被称为随机化抽样的随机化技术来解决这一问题。与原始版本的快速排序中始终以A[r]作为划分待排数组的主元不同,随机化版本是从A[p..r]中随机取一个元素,将其与A[r]交换后作为主元。这样一来,无论输入数组的原始顺序如何,即使是已经排好序的数组,在平均请下随机抽样选择的主元都能使数组的划分更平衡。
二 快速排序随机化的实现
与原始版本相比,随机化的快速排序只在选取主元的时候有改动,其他地方不变。
1 用于整数数组的升序排序
private static int Partition(int[] array, int p, int r)
{
int x = array[r];
int i = p - 1;
for (int j = p; j < r; j++)
{
if (array[j] < x)
{
i++;
Exchange(ref array[i], ref array[j]);
}
}
i++;
Exchange(ref array[i], ref array[r]);
return i;
}
public static int RandomizedParition(int[] array, int p, int r)
{
Random random = new Random();
int i = random.Next(p, r + 1);
Exchange(ref array[i], ref array[r]);
return Partition(array, p, r);
}
private static void RandomizedQuickSort(int[] array, int p, int r)
{
if (p < r)
{
int q = RandomizedParition(array, p, r);
RandomizedQuickSort(array, p, q - 1);
RandomizedQuickSort(array, q + 1, r);
}
}
public s