【面试】在快速排序中，pivot是如何影响算法的时间复杂度的？

Lewiz_124

于 2024-08-09 20:51:07 发布

阅读量448

点赞数 10

分类专栏：面试文章标签：算法面试排序算法

本文链接：https://blog.csdn.net/Lewiz_124/article/details/141070790

版权

24 篇文章 0 订阅

订阅专栏

面试官: 你能解释一下在快速排序中，pivot（基准元素）是如何影响时间复杂度的吗？

概念：

快速排序是一种分治算法，它通过递归的方式将数组分成两部分，分别对每部分进行排序。具体而言，快速排序的核心步骤是：
1. 选择一个基准元素（pivot）。
2. 将数组重新排列，使得所有小于pivot的元素在它的左边，所有大于pivot的元素在它的右边（分区操作）。
3. 递归地对左半部分和右半部分进行排序。

时间复杂度：

快速排序的时间复杂度主要取决于每次分区后子数组的大小。如果每次分区都能将数组均匀地分成两部分，那么时间复杂度为 $\log n)$ 。相反，如果分区严重不均匀，时间复杂度可能退化为 $O(n^2)$ 。

最佳情况：

均匀分割：
- 如果每次选择的pivot都能将数组均匀地分成两部分（例如，每次pivot都恰好是中位数），则每次递归处理的子数组规模大约是原数组的一半。此时，快速排序的时间复杂度为 $\log n)$ 。
- 这时，算法的递归深度为 $\log n$ ，每次分区操作的时间为 $O (n)$ ，总的时间复杂度为 $\log n)$ 。

最坏情况：

极端分割：
- 如果每次选择的pivot总是数组中的最大或最小元素（例如，数组已经有序或接近有序，且总是选择第一个或最后一个元素作为pivot），则分区后的子数组会极端不均匀。一个子数组的大小为0，另一个子数组的大小为 $n - 1$ 。
- 这意味着递归的深度将是 $n$ 而不是 $\log n$ ，每次分区操作的时间仍然为 $O (n)$ ，总的时间复杂度会退化为 $O(n^2)$ 。

一般情况：

随机分割：
- 在大多数情况下，如果pivot选择相对合理，分区会产生大小接近的子数组。尽管不是完美的均分，但通常也足以使得时间复杂度接近 $\log n)$ 。
- 随机选择pivot是一种常见的策略，能够有效降低最坏情况出现的概率，保证在平均情况下时间复杂度为 $\log n)$ 。

中位数作为pivot：

中位数选择：
- 如果能够在每次分区时准确找到数组的中位数作为pivot，理论上可以保证每次分区都能将数组均匀分成两部分，从而始终保持最佳情况的时间复杂度 $\log n)$ 。然而，找到中位数本身需要 $O (n)$ 的时间，这在某些情况下可能会抵消快速排序的效率优势。

随机选择pivot：

随机性引入：
- 随机选择pivot是一种有效的策略，可以避免输入数据特性导致的最坏情况。通过随机选择，快速排序的平均时间复杂度为 $\log n)$ 。
- 随机选择降低了最坏情况的出现概率，使得快速排序在绝大多数情况下都能高效运行。

三数取中（Median of Three）：

优化选择：
- 三数取中是一种优化策略，通过选择数组开头、中间和结尾三个元素的中位数作为pivot，增加了均匀分割的概率，从而减少最坏情况的发生。
- 这种方法可以有效改善实际排序的性能，特别是在处理已经有序或接近有序的数据时。

均匀性和递归深度： Pivot选择的均匀性直接影响递归的深度。如果能选择使分区均匀的pivot，快速排序的时间复杂度将保持在 $\log n)$ 。
极端情况的避免： 在实际应用中，使用随机选择或三数取中等策略可以有效避免极端情况，使得快速排序在平均情况下表现优异。
实际性能优化： 尽管找到完美的pivot（如中位数）可以保证最优的时间复杂度，但在实际应用中，更简单的随机选择或三数取中往往已经足够好，并且更易于实现。

关注

专栏目录