算法设计与分析——排序算法（七）：快速排序-[快速排序的随机化]

最新推荐文章于 2023-05-10 10:54:08 发布

von Neumann

最新推荐文章于 2023-05-10 10:54:08 发布

阅读量1.1w

点赞数 5

分类专栏：算法设计与分析文章标签：算法算法导论数据结构快速排序排序算法

本文链接：https://blog.csdn.net/hy592070616/article/details/120104121

版权

算法设计与分析专栏收录该内容

49 篇文章 53 订阅

订阅专栏

在讨论快速排序的平均情况性能的时候，我们的前提假设是：输入数据的所有排列都是等概率的。但是在实际工程中，这个假设并不会总是成立。正如在《快速排序-[快速排序的性能]》中我们所看到的那样，有时我们可以通过在算法中引入随机性，从而使得算法对于所有的输入都能获得较好的期望性能。很多人都选择随机化版本的快速排序作为大数据输入情况下的排序算法。

在《快速排序-[快速排序的性能]》中，我们通过显式地对输入进行重新排列，使得算法实现随机化。当然，对于快速排序我们也可以这么做。但如果采用一种称为随机抽样的随机化技术，那么可以使得分析变得更加简单。与始终采用 $A [r]$ 作为主元的方法不同，随机抽样是从子数组 $A[p\cdots r]$ 中随机选择一个元素作为主元。为达到这一目的，首先将 $A [r]$ 与从 $A[p\cdots r]$ 中随机选出的一个元素交换。通过对序列 $[p\cdots r]$ 的随机抽样，我们可以保证主元元素 $x = A [r]$ 是等概率地从子数组的 $r - p + 1$ 个元素中选取的。因为主元元素是随机选取的，我们期望在平均情况下，对输入数组的划分是比较均衡的。

对partition(arr,low,high)和quick_sort(arr,low,high)的代码的改动非常小。在新的划分程序中，我们只是在真正进行划分前进行一次交换：

def randomized_partition(arr,low,high):
	import random
	i = random.randint(low,high)
	arr[i], arr[high] = arr[high], arr[i]
	return partition(arr,low,high)

随机化版本的快速排序中的分区函数由原先的partition(arr,low,high)改为randomized_partition(arr,low,high)即可。在《快速排序-[快速排序的分析]》一文中我们将会对这个算法进行详尽的分析。

von Neumann

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
算法设计与分析——排序算法（七）：快速排序-[快速排序的随机化]

在讨论快速排序的平均情况性能的时候，我们的前提假设是：输入数据的所有排列都是等概率的。但是在实际工程中，这个假设并不会总是成立（见练习7.2-4）。正如在5.3节中我们所看到的那样，有时我们可以通过在算法中引入随机性，从而使得算法对于所有的输入都能获得较好的期望性能。很多人都选择随机化版本的快速排序作为大数据输入情况下的排序算法。在5.3节中，我们通过显式地对输入进行重新排列，使得算法实现随机化。当然，对于快速排序我们也可以这么做。但如果采用一种称为随机抽样（ random sampling）的随机化技术
复制链接

扫一扫