分类目录:《算法设计与分析》总目录
相关文章:
· 排序算法(一):插入排序
· 排序算法(二):归并排序
· 排序算法(三):堆排序
· 排序算法(四):选择排序
· 排序算法(五):冒泡排序
· 排序算法(六):希尔排序
· 排序算法(七):快速排序
\qquad
· ①基础知识
\qquad
· ②快速排序的性能
\qquad
· ③快速排序的随机化
\qquad
· ④快速排序的分析
· 排序算法(八):计数排序
· 排序算法(九):基数排序
· 排序算法(十):桶排序
· 排序算法:比较排序算法的下界
· 排序算法:十大排序算法总结
在讨论快速排序的平均情况性能的时候,我们的前提假设是:输入数据的所有排列都是等概率的。但是在实际工程中,这个假设并不会总是成立。正如在《快速排序-[快速排序的性能]》中我们所看到的那样,有时我们可以通过在算法中引入随机性,从而使得算法对于所有的输入都能获得较好的期望性能。很多人都选择随机化版本的快速排序作为大数据输入情况下的排序算法。
在《快速排序-[快速排序的性能]》中,我们通过显式地对输入进行重新排列,使得算法实现随机化。当然,对于快速排序我们也可以这么做。但如果采用一种称为随机抽样的随机化技术,那么可以使得分析变得更加简单。与始终采用 A [ r ] A[r] A[r]作为主元的方法不同,随机抽样是从子数组 A [ p ⋯ r ] A[p\cdots r] A[p⋯r]中随机选择一个元素作为主元。为达到这一目的,首先将 A [ r ] A[r] A[r]与从 A [ p ⋯ r ] A[p\cdots r] A[p⋯r]中随机选出的一个元素交换。通过对序列 [ p ⋯ r ] [p\cdots r] [p⋯r]的随机抽样,我们可以保证主元元素 x = A [ r ] x=A[r] x=A[r]是等概率地从子数组的 r − p + 1 r-p+1 r−p+1个元素中选取的。因为主元元素是随机选取的,我们期望在平均情况下,对输入数组的划分是比较均衡的。
对partition(arr,low,high)
和quick_sort(arr,low,high)
的代码的改动非常小。在新的划分程序中,我们只是在真正进行划分前进行一次交换:
def randomized_partition(arr,low,high):
import random
i = random.randint(low,high)
arr[i], arr[high] = arr[high], arr[i]
return partition(arr,low,high)
随机化版本的快速排序中的分区函数由原先的partition(arr,low,high)
改为randomized_partition(arr,low,high)
即可。在《快速排序-[快速排序的分析]》一文中我们将会对这个算法进行详尽的分析。