【面试】如何从100万个无序数中找到第20万小的数？

Lewiz_124

已于 2024-08-15 13:58:51 修改

阅读量483

点赞数 16

分类专栏： # 数据结构面试文章标签：面试算法数据结构

于 2024-08-15 13:58:19 首次发布

本文链接：https://blog.csdn.net/Lewiz_124/article/details/141220395

版权

13 篇文章 0 订阅

订阅专栏

面试官: 你如何从100万个无序数中找到第20万小的数？

基本思路：

实现步骤：

时间复杂度：

优点与缺点：

基本思路：

Quickselect是一种基于快速排序思想的选择算法，能够在期望 $O (n)$ 的时间内找到第k小的数。它与快速排序类似，但只关注递归中包含第k小元素的那一侧，不需要完全排序整个数组。

实现步骤：

随机选择一个基准数（pivot），将数组划分为小于基准数和大于基准数的两部分。
统计基准数位置之前的元素个数：
- 如果恰好是第k个元素，则基准数就是所求的数。
- 如果小于k，递归处理右侧部分（k减去基准数左侧元素个数后处理）。
- 如果大于k，递归处理左侧部分。
重复上述过程，直到找到第k小的数。

时间复杂度：

时间复杂度分析：

单次分区操作：
- 每次分区操作的时间复杂度是 $O (n)$ ，因为每个元素都被比较一次以决定其在基准数的左边还是右边。
递归的深度：
- 在平均情况下，Quickselect 的每次递归都会将问题规模减半（即在数组的一半部分中查找），所以递归深度是 $O(\log n)$ 。
总时间复杂度：
- 因为 Quickselect 只处理包含第 $k$ 小元素的那一部分，所以在理想情况下，总时间复杂度为 $\dots \approx O(2n) = O(n)$ 。
最坏情况：
- 在最坏情况下，基准数每次都没有将问题规模有效减半，而是将问题递归到几乎整个数组。这时递归的深度为 $O (n)$ ，导致最坏时间复杂度为 $O(n^2)$ 。然而，通过随机化选择基准数或其他优化策略，可以避免这种最坏情况，保持平均 $O (n)$ 的时间复杂度。