我们可以在 O ( n log k ) O(n\log k) O(nlogk) 的时间内获得一个序列内的第 k k k 大的数。但是有没有更快的方法?
快速选择
一种方法是仿照快速排序,每次随机选择一个主元,并且将小于它和大于它的元素分别放到它的左边和右边。这样我们就很容易判断第 k k k 大的元素在哪一部分,从而递归的去寻找。
最优情况下,我们每次找到的都是中位数,这样时间复杂度是线性的。但在极端情况下,对于某个序列和某个 k k k,该算法的时间复杂度会退化到 O ( n 2 ) O(n^2) O(n2) 级别。而最原始的快速排序也有可能退化到这一复杂度。
BFPRT 算法
下面要介绍的 BFPRT 算法就是一个能在严格的线性时间内筛选出一个序列的第 k k k 大的数的算法。它的精髓在于选取主元的过程。它并不是随机选取一个主元,而是反复调用自身进行主元的选取——也就是说,每次选取主元相当于就是在求解一个规模更小的线性选择问题。
它的步骤如下:
- 将 n n n 个元素划分成为 ⌊ n 5 ⌋ \lfloor \frac{n}{5}\rfloor ⌊