第k小元素（顺序统计量）_找出数组中第k小元素的时间复杂度-CSDN博客

本文链接：https://blog.csdn.net/yzf0011/article/details/69055395

在一个含有n个元素的集合中，有时我们需要找到第该集合中第 $k$ 个小的元素，这也被称作第 $k$ 个顺序统计量(order statistic)。在前面我们已学过排序, 我们可以将集合进行排序后，直接输出第 $k$ 个元素。但是我们目前我们知道的排序中最好的时间复杂度就是 $O(nlog(n))$ . 接下来我们要使用两种方法找出第k小元素，其在某些过程用到排序，但我们并不会对整个集合进行排序，也不会使得最终的集合是顺序的。这两中方法一个是期望时间复杂度是 $O(n)$ , 而另一个实际时间复杂度就是 $O(n)$ .
这里写图片描述

1. 期望时间的选择算法

算法思想

这里我们要用到快速排序的思想，快速排序是将 $1$ 个关键字pivot_key排到整个集合中的正确位置，并将整个集合分成两个部分，左边都不比它大，而右边的都不比它小，如果我们现在将这个关键字pivot_key所在位置pivot_pos和我们的 $k$ （所要求的第 $k$ 个顺序统计量）比较，若相等则返回；若小于则访问pivot_key左边的第 $k$ 个顺序统计量；否则访问pivot_key右边的第 $k - pivot\_pos$ 个顺序统计量（不包括pivot_key）。

算法实现

下面我们直接通过代码来说明问题：

int randomized_Partition(int *arr, int from, int to) {
    int pivot_key = arr[from];

    int low = from;
    int high = to;

    while (low < high) {
        while (low < high && pivot_key <= arr[high]) {
            --high;
        }
        arr[low] = arr[high];

        while (low < high && pivot_key >= arr[low]) {
            ++low;
        }
        arr[high] = arr[low];
    }
    arr[high] = pivot_key;
    return high;
}

上面的代码我们很容易就是快速排序将集合分成两部分，并放回pivot_key, 正确的位置。

int randomized_select(int *arr, int from , int to, int i) {
    if (from == to) {
        return arr[from];
    }

    // 算出arr[from] 所在的 pivot 位置
    int q = randomized_Partition(arr, from, to);

    // arr[from] 所在序列中第几个元素
    int k = q -from + 1;
    int result;
    if (i == k) {
        result = arr[q];
    } else if (i < k) {
        result = randomized_select(arr, from, q - 1, i);
    } else {
        result = randomized_select(arr, q + 1, to, i - k);
    }
    return result;
}

这剩下的这一部分代码就是我们上述提到的核心思想。

算法分析

z这里我们主要分析它为什么期望时间是 $O(n)$ , 我们在这里假设 $X_k$ 表示有k个元素的事件，且经过一次randomized_Partition我们要找的第 $i$ 个顺序统计量都在 $X_k$ (即pivot_key的左边部分或右边部分)里，且 $P(X_k=1) = \frac{1}{n}$ ( $X_k$ 这事件会发生的概率), 这样我们从上面的randomized_select可以分析到其时间复杂度 $T()$ 满足如下关系：

T (n) \leq \sum k = 1 n X k (T (k) + O (n))

$T(n) \leq \sum_{k = 1}^nX_k(T(k) + O(n))$
所以可得其期表达式：

E (T (n)) \leq E (\sum k = 1 n X k (T (k) + O (n))) = \sum k = 1 n (E (X k) T (X k)) + O (n) = \sum k = 1 n (1 n T (X k) + O (n))

$\begin{align} E(T(n)) & \leq E(\sum_{k = 1}^nX_k(T(k) + O(n)))\\ &=\sum_{k=1}^n(E(X_k)T(X_k)) + O(n)\\ &= \sum_{k=1}^n(\frac{1}{n}T(X_k) + O(n)) \end{align}$
而上述公式最终算出的期望值恰好为

T(n)=O(n) $T(n) = O(n)$

2. 最坏情况为线性时间的选择算法

算法步骤

先假设我们这个算法函数为Select()
1) 将输入数组arr的 $n$ 个元素划分为 $\left \lfloor \frac{1}{5} \right \rfloor$ , 每组 $5$ 个元素，且之多只有一组剩下的 $n mod 5$ 个元素组成。
2) 找这 $\left \lceil \frac{n}{5} \right \rceil$ 组中每一组的中位数：首先对每组元素进行插入排序，然后确定每组有序元素的中位数。
3) 对第2步中找出的 $\left \lceil \frac{n}{5} \right \rceil$ 个中位数，递归调用Select()找出其中位数 $x$
4) 利用修改过的partition函数，找出这个 $x$ 在整个数组arr中, 的正确位置 $i$ ，这样就使得在数组arr中，左边的数都不比它大，而右边的数都不比它小。
5) 如果 $i = k$ , 则返回x。因此x就是第 $k$ 小元素。如果 $i \lt k$ , 则在 $x$ 的左边找第 $i$ 小的元素。否则在 $x$ 的右边（不包括 $x$ ）找第 $i-k$ 小的元素。
t通过上述算法描述，我们可以利用下面一张图进行形象化。
这里写图片描述

算法实现

插入排序

// 插入排序
void insertSorting(int *arr, int from, int to) {

    int i, j, t;
    int sc;
    for (i = from + 1; i <= to; ++i) {
        sc = arr[i];
        j = i - 1;
        while(j >= from) {
            // 找到一个不满足arr[j] <= sc
            if (arr[j] > sc) {
                --j;
            } else {
                break;
            }
        }
        // 将arr[j + 1, i - 1]向前移动一个位置
        // 即arr[j + 2, i]
        for (t = i; t > j; --t) {
            arr[t] = arr[t - 1];
        }
        arr[j + 1] = sc;
    }
}

改版的partition

// 讲指定位置pivot的元素作为主元
int partition(int *arr, int from, int to, int pivot) {
    int sc = arr[pivot];
    swap(arr + from, arr + pivot);
    int low = from;
    int high = to;
    while (low < high) {
        while (low < high && sc <= arr[high]) {
            --high;
        }
        arr[low] = arr[high];

        while (low < high && sc >= arr[low]) {
            ++low;
        }
        arr[high] = arr[low];
    }
    arr[low] = sc;
    return high;
}

上述算法核心就是BFPRT算法：

// 利用BFPRT 求解第k小元素
int BFPRT(int *arr, int from, int to, int ith) {
    // 当元素小于5个的时候直接插入并且返回
    if(to - from + 1 <= 5) {
        insertSorting(arr, from, to);
        return arr[from + ith - 1];
    }

    int t = from - 1;
    // 作为每5个数组的开始和结束的index
    int st, ed;
    // 至少有一组元素能进入这个循环, 也就是 to - from + 1 > 5
    for (st = from; (ed = st + 4) <= to; st += 5) {
        insertSorting(arr, st, ed);
        ++t;
        swap(arr + t, arr + st + 2);
    }

    // 关心的是中位数的位置，而不是中位数的值
    int pivot = (from + t) >> 1;
    BFPRT(arr, from, t, pivot - from + 1);

    int m = partition(arr, from, to, pivot);
    // pivot 为第几小
    int cur = m - from + 1;

    int res;
    if (cur == ith) {
        res = arr[m];
    } else if (cur < ith) {
        res = BFPRT(arr, m + 1, to, ith - cur);
    } else {
        res = BFPRT(arr, from, m - 1, ith);
    }
    return res;
}

算法分析

从上图分析，如果我们去掉数组arr最右边不足5个那一组，以及中位数 $x$ 所在的那一组，我们可以判定 $x$ 至少大于这么多数

3 (⌈ 1 2 ⌈ n 5 ⌉ ⌉ - 2) \geq 3 n 10 - 6

$3\bigg(\left \lceil \frac{1}{2} {\left \lceil \frac{n}{5} \right \rceil}\right \rceil - 2\bigg) \geq \frac{3n}{10} - 6$
也就是说，经过一次迭代或每一轮我们的就能确定至少有

3n10 $\frac{3n}{10}$ 比

x $x$ 小，则我们在最坏的情况，只需要和剩下的

7n10+6 $\frac{7n}{10} + 6$ 个数进行新一轮迭代。
如果我们假设每次迭代都没找到我们的第

k $k$ 小元素，则我们会有如下关于时间复杂度的数学关系式：

f (n) \leq {O (1), T (⌈ n / 5 ⌉) + T (7 n / 10 + 6) + O (n), if n < 140 if n \geq 140

$\begin{align} f(n) \leq \begin{cases} O(1), & \mbox{if }n \lt 140 \\ T(\left \lceil n/5 \right \rceil) + T(7n/10 + 6) +O(n), & \mbox{if }n \geq 140 \end{cases} \end{align}$
接下来我们着重分析

n≥140 $n\geq 140$ 的情况。我们的算法主要有

3 $3$ 个耗时的步骤：

步骤	耗时
对 $\left \lceil n/5 \right \rceil$ 个数组分别进行插入排序 $O(n)$ 对 $\left \lceil n/5 \right \rceil$ 个中位数查找他们之间的中位数 $T(\left \lceil n/5 \right \rceil)$ 最坏情况下，对剩下的元素查找第 $k$ 小元素	$T(7n/10 + 6)$ $f(n)= O(n)$ 就不详细数学公式证明(读者可以尝试使用 $f(n) = an + b$ 来证明)。讨论期望为线性时间的选择算法和最坏情况为线性时间的选择算法有什么区别？期望为线性时间的选择算法每次都是选择的 $arr[from ... to]$ 中的第 $1$ 个作为pivot_key，所以它下一次查找的子数组的个数是不确定，具有很大的随机性，所以它在概率下时间复杂度为 $O(n)$ ；而最坏情况为线性时间的选择算法它每次选择的pivot_key是特定的，这个特定的pivot_key使得至少有 $\frac{3n}{10} - 6$ 个元素比其小或等于，在最坏情况下，我们只需要对剩下的 $7n/10 + 6$ 个元素组成的子集进行查找我们需要的第 k <script type="math/tex" id="MathJax-Element-62">k</script>小元素。致谢本文是基于《算法导论》写的，最主要的是有本人大量的心得体会，感谢《算法导论》的那些作者Thomas H.Cormen、Charles E.Leiserson等人。如果有错误的请留言，不甚感激。谢谢。参考《算法导论》Thomas H.Cormen、Charles E.Leiserson等第三版第9章 “中位数和顺序统计量” 源代码：等上传完，附上转载，请注明确定要放弃本次机会？福利倒计时 : : 立减 ¥ 普通VIP年卡可用立即使用 fourye007 关注关注 0 点赞踩 2 收藏觉得还不错? 一键收藏 0 评论第k小元素（顺序统计量）在一个含有n个元素的集合中，有时我们需要找到第该集合中第kk个小的元素，这也被称作第kk个顺序统计量(order statistic)。在前面我们已学过排序, 我们可以将集合进行排序后，直接输出第kk个元素。但是我们目前我们知道的排序中最好的时间复杂度就是O(nlog(n))O(nlog(n)). 接下来我们要使用两种方法找出第k小元素，其在某些过程用到排序，但我们并不会对整个集合进行排序，也不会使复制链接扫一扫专栏目录 C++实现第K顺序统计量的求解方法 09-04 在C++编程中，第K顺序统计量是一个重要的概念，它指的是在一组无序的数据集中找到第K小的元素。这种统计量在数据分析、算法设计和优化中具有广泛的应用。在给定的文件中，主要讨论了如何使用C++实现线性时间复杂度的... BFPRT算法：时间复杂度O(n)求第k小的数字（分治算法+快排）机器学习 12-25 6679 去年写了一篇《分治算法求第k小元素 O(n)》的文章。介绍了一种对快排进行改进的算法，可以在时间复杂度O(n)的情况下，找到第k小的数字。那时候，我还不知道这个算法叫BFPRT算法——现在知道了，还知道它又被称为中位数的中位数算法，它的最坏时间复杂度为O(n)，它的思想是修改快速选择算法的主元选取方法，提高算法在最坏情况下的时间复杂度。而且，我还发现了STL中有一个类似的函数——std::nth_element （位于头文件`&amp;amp;amp;amp;lt;algorithm&am 参与评论您还未登录，请先登录后发表或查看评论第K小元素时间复杂度n 搭车去柏林的博客 06-13 3766 文章目录一、题目分析二、计算思路伪代码三、Java实现四、时间复杂度一、题目分析给出一个n个元素的序列，求其中的第k小元素(即序列按升序排序后的第k个元素) 如果用排序时间复杂度nlogn，随机快速排序时间复杂度n。但是这里采用一种分治的方法使时间复杂度为n。若分治算法中，每次分解子问题后，只取其中一个子问题解之，丢弃其余的子问题。每次递归调用，问题的规模以常数因子被减小。设分解问题只需线性时间，则算法的时间复杂性满足Θn\Theta nΘn。二、计算思路伪代码大致思路是选一个“主元”,比他大的解决寻找第K小元素问题——三种不同的算法实现 Zetrue_Li Blog 09-12 3万+ 个人原创，禁止转载——Zetrue_Li 问题描述：在一个序列里找出第K小元素以下程序基于函数 int select_kth_smallest(list q, int k) 实现：返回向量q中第k最小元的函数算法一：基于冒泡排序思想，暴力求解：基本思路：要求找出第k个最小元素，可以通过在序列中遍历k次，每次找出最小的，并放在序列头。类似泡泡一样，找出第k个大的泡泡（bu... 线性时间选择—寻找第k小的数（分治算法） qyh的博客 06-22 5075 问题描述：找出一个数组中第K小的元素，时间复杂度为O(n)。思想首先，找出数组元素的中位数的中位数，然后利用Partition函数对整个数组进行划分，以数组中中位数的中位数为基准将数组划分为两部分——左边部分的所有数都小于基准，右边部分都大于基准，并返回基准数的下标值。最后，如果要找到第k小个数,就将k的大小与数组左半边元素的个数（包括基准）进行比较，如果k小于j，则对左边部分进行递归，找第k小个数；若k大于j，则对右边部分进行递归，找第k减去j个小数。代码如下： #include "stdafx 求第k小元素 bull521的博客 08-09 3860 题目：给定线性序集中n个元素和一个整数k，其中1<=k<=n，要求找出这n个元素中第k小的元素。如果将这n个元素线性序排列时，如果不存在重复的数或者求第k个元素的时候，那么第k个位置即为要找的元素。当k = 1时，要找的就是最小值；而当k = n时，则要找的则是最大值。凭借着快速排序中的划分函数，可以实现上面的功能。对于序列a[p : q]，分治算法rando... 拜托，面试别再问我TopK了！！！ weixin_33912638的博客 09-21 230 前言：本文将介绍随机选择，分治法，减治法的思想，以及TopK问题优化的来龙去脉，原理与细节，保证有收获。面试中，TopK，是问得比较多的几个问题之一，到底有几种方法，这些方案里蕴含的优化思路究竟是怎么样的，今天和大家聊一聊。画外音：除非校招，我在面试过程中从不问TopK这个问题，默认大家都知道。问题描述：从arr[1, n]这n个数中，找出最... 线性时间内找到第k小的元素：快排应用与BFPRT算法 RealCoder的博客 07-14 810 目录问题分析快排应用BFPRT算法问题分析面对这个问题，最简单的想法是对数据进行排序，然后根据下标即可找到第k小的元素，目前已知的排序算法的最低时间复杂度为O(nlog⁡2log⁡2n)O(n\sqrt{\log_2 {\log_2 n}})O(nlog2log2n)，但并不为人熟知。目前应用最广的排序算法的最低时间复杂度为O(nlog⁡2n)O(n\log_2 n)O(nlog2n)。但是，作为完美主义者的程序员，需要思考，找到第k小的元素一定需要排序吗？但除了寻找最大或最小的元素之外，我们算法-顺序统计量 04-03 顺序统计量，通常表示为STOQ（Sequential k-th Order Statistic），指的是在未排序的数据集合中，通过一次遍历找出第k个最小（或最大）元素的过程。例如，在一个数组中找到最小值就是找到第一个顺序统计量，找到第二... 算法导论中位数和顺序统计量 05-25 顺序统计量，例如第k小（大）的元素，是在不完全排序的数据集上查找特定位置的元素。在大数据集上，使用线性搜索效率低下，因此需要更高效的算法。一种常见方法是利用优先队列（堆）数据结构。例如，可以维护一个... python-leetcode面试题解之第347题前K个高频元素.zip 最新发布 06-25 在本压缩包中，我们关注的是一个Python编程与算法相关的面试题目，具体是LeetCode的第347题——"前K个高频元素"。这道题目是数据结构与算法领域的一个经典问题，通常出现在软件工程师的求职面试中，尤其是对于Python... 计算序列第 k 小的元素【算法设计与分析】不是一切星星都仅指示黑暗 01-17 1761 实验问题：给定一个序列，求出此序列第k小的元素问题分析：可以利用快速排序，随机取一个元素将比它小的数放在它的右边，比它大的数放在左边。根据左子集的元素个数可以分为三种情况：第一种：nleft=k-1 那么分界数据即为问题的答案；第二种：nleft>k-1 那么第k小的数存在于左子集中问题规模减小；第三种：nleft<k-1 那么第k小的数存在于右子集中，问题变为选择第k-nleft-1小的数。数学建模：建立函数get_kSmall（arr，begin，end，分治法-查找第k小问题 m0_52233414的博客 09-24 3302 对于给定的含有n个元素的无序序列，求这个序列中第k(1≤k≤n)小的元素。算法题04：分治法：求第K小元素（线性时间选择算法）热门推荐宇智波Akali的博客 04-01 3万+ 求第k小元素题目内容：给定一个线性序列集，要求使用分治法求出其中指定的第 KKK 小的数的值和位置，如给定 nnn 个元素和一个整数 iii，1≤i≤n1≤i≤n1≤i≤n，输出这 nnn 个元素中第 iii 小元素的值及其位置。一、问题分析（模型、算法设计和正确性证明等）解决第K小问题有如下几种方法 ①将n个数排序(比如快速排序或归并排序)，选取排序后的第k个数，时间复杂度为O(nlog... 算法——（分治）寻找第k小的元素 lzyyzl01的博客 03-29 1009 参考文案 BFPRT-＞求无序数组中第K小的数：要求时间复杂度O(n)：两种方法！芬达的成长之路 01-04 528 昨天和好友 @覃会程仔细探讨了关于在无序数组中求第K小或者第K大的数这道题，记下来->直呼妙啊！需要奠定的知识点在快排的基础上，又不与快排相似，正是这个不相似的点，让时间复杂度由O（NlogN）收敛道O（N）以及 ... 分治法——查找问题 —— 寻找一个序列中第k小的元素和查找最大和次大元素 gl620321的博客 08-25 7034 问题：对于给定的含有n个元素的无序序列，求这个序列中第k（1<=k<=n）小的元素分析思路：假设无序序列存放在a[0 … n-1]中，若将a递增排序，则第k小的元素为a[k-1]. 对于无序序列a[s … t]，在其中查找第k小的元素（1）若s>=t，其中只有一个元素或没有任何 ... 寻找第k小的元素--分治算法 weixin_40990652的博客 04-15 5144 如果元素个数小于阙值44，则算法使用排序的方法计算第k小的元素更快。（具体晚点再更）使用分治算法求第k小的元素（本例为中项）：令n=25 A[25]={8,33,17,51,57,49,35,11,25,37,14,3,2,13,52,12,6,29,32,54,5,16,22,23,7} A[n]表示数组中第n个元素 1.k=n/2（向上取整）=13 2.将数组划分为五组 A1... 转载：求第k小的数、第k大的数、中位数的三种算法(nth_element()、快速选择算法、直接排序法) kevin的博客 03-22 608 转载：https://blog.csdn.net/qq_41708792/article/details/103130479?utm_medium=distribute.pc_relevant.none-task-blog-searchFromBaidu-14.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-searchFromBaidu-14.control chap14数据结构的扩张1.PDF 08-03 动态顺序统计主要关注如何在不断变化的数据集合中快速获取第k小（或大）的元素。这在操作系统中称为OS树（Order-Statistic Tree）。OS树是一种具有额外信息的二叉搜索树，每个节点除了包含常规的关键值外，还记录了... “相关推荐”对你有帮助么？非常没帮助没帮助一般有帮助非常有帮助提交 fourye007 CSDN认证博客专家 CSDN认证企业博客码龄11年暂无认证 85 原创 10万+ 周排名 47万+ 总排名 23万+ 访问等级 2784 积分 30 粉丝 130 获赞 41 评论 281 收藏私信关注热门文章 csv.Error: iterator should return strings, not bytes 43676 SPP(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition) 20536 在Linux里，防止文件被删除(chattr命令详解) 17283 SVM 中 rbf kernel 的意义 —— 一个不怎么严谨的解释 14346 linux 安装VMware问题解决-解决ubuntu上VMware： Gtk-WARNING **: 无法在模块路径中找到主题引擎：“murrine 11813 分类专栏 deep learning 2篇 3d bounding box 2篇 c++知识 java 6篇 qt 2篇 java web 1篇 Android 13篇 ubuntu 8篇 Algorithm 9篇 deep-learning 20篇 cuda 2篇 tensorflow 3篇 python 9篇数学基础 3篇图像 4篇 leetcode-c 22篇 Evaluate 1篇 Reverse Polish Notation Reverse 1篇 Polish 1篇 Notation 1篇 gitbook 1篇 pytorch 2篇 RuntimeError type 最新评论 csv.Error: iterator should return strings, not bytes __Cxuan__: 当采用“rb”模式打开文件时，应该不能设置encoding参数吧？另外跟是不是二进制文件也没有关系，即使是这里也会报错。csv文件是文本文件，当采用“rb”模式打开时显示为二进制形式，此处是说Iterator不能返回字节类型，而我在此处发现的问题跟Python版本有关，如果用老的Py2.7那么是可以执行的，Python3.似乎不行；当然，如果直接用”rt“模式打开肯定是没有问题的 csv.Error: iterator should return strings, not bytes 漆黑的橘子: rt是以text打开，写成r也可以，因为r的话默认用text打开，和rt等效 SPP(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition) lsd20153410: 想问一下全连接输出4096是怎么算出来的啊 kde-config-telepathy-accounts > 15.04 二代红鱼: 有用，谢谢博主 csv.Error: iterator should return strings, not bytes weixin_42685694: 点赞！您愿意向朋友推荐“博客详情页”吗？强烈不推荐不推荐一般般推荐强烈推荐提交最新文章 Monocular 3D Object Detection and Box Fitting Trained End-to-End Using Intersection-over-Union Loss M3D-RPN jupyte添加不同版本的python version 2019年8篇 2018年1篇 2017年75篇 2016年4篇 2015年5篇 2014年15篇 2013年2篇目录目录分类专栏 deep learning 2篇 3d bounding box 2篇 c++知识 java 6篇 qt 2篇 java web 1篇 Android 13篇 ubuntu 8篇 Algorithm 9篇 deep-learning 20篇 cuda 2篇 tensorflow 3篇 python 9篇数学基础 3篇图像 4篇 leetcode-c 22篇 Evaluate 1篇 Reverse Polish Notation Reverse 1篇 Polish 1篇 Notation 1篇 gitbook 1篇 pytorch 2篇 RuntimeError type 目录评论被折叠的条评论为什么被折叠? 到【灌水乐园】发言查看更多评论添加红包祝福语请填写红包祝福语或标题红包数量个红包个数最小为10个红包总金额元红包金额最低5元余额支付当前余额3.43元前往充值 > 需支付：10.00元成就一亿技术人! 领取后你会自动成为博主和红包主的粉丝规则 hope_wisdom 发出的红包实付元使用余额支付点击重新获取扫码支付钱包余额 0 抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。余额充值

步骤

耗时

对

⌈n/5⌉ $\left \lceil n/5 \right \rceil$ 个数组分别进行插入排序

O(n) $O(n)$ 对

⌈n/5⌉ $\left \lceil n/5 \right \rceil$ 个中位数查找他们之间的中位数

T(⌈n/5⌉) $T(\left \lceil n/5 \right \rceil)$ 最坏情况下，对剩下的元素查找第

k $k$ 小元素

T(7n/10+6) $T(7n/10 + 6)$

$f(n)= O(n)$ 就不详细数学公式证明(读者可以尝试使用 $f(n) = an + b$ 来证明)。

讨论

期望为线性时间的选择算法和最坏情况为线性时间的选择算法有什么区别？
期望为线性时间的选择算法每次都是选择的 $arr[from ... to]$ 中的第 $1$ 个作为pivot_key，所以它下一次查找的子数组的个数是不确定，具有很大的随机性，所以它在概率下时间复杂度为 $O(n)$ ；而最坏情况为线性时间的选择算法它每次选择的pivot_key是特定的，这个特定的pivot_key使得至少有 $\frac{3n}{10} - 6$ 个元素比其小或等于，在最坏情况下，我们只需要对剩下的 $7n/10 + 6$ 个元素组成的子集进行查找我们需要的第 k <script type="math/tex" id="MathJax-Element-62">k</script>小元素。

致谢

本文是基于《算法导论》写的，最主要的是有本人大量的心得体会，感谢《算法导论》的那些作者Thomas H.Cormen、Charles E.Leiserson等人。如果有错误的请留言，不甚感激。谢谢。

参考

《算法导论》Thomas H.Cormen、Charles E.Leiserson等第三版第9章 “中位数和顺序统计量”

源代码：

等上传完，附上

转载，请注明

fourye007

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
第k小元素（顺序统计量）

在一个含有n个元素的集合中，有时我们需要找到第该集合中第kk个小的元素，这也被称作第kk个顺序统计量(order statistic)。在前面我们已学过排序, 我们可以将集合进行排序后，直接输出第kk个元素。但是我们目前我们知道的排序中最好的时间复杂度就是O(nlog(n))O(nlog(n)). 接下来我们要使用两种方法找出第k小元素，其在某些过程用到排序，但我们并不会对整个集合进行排序，也不会使
复制链接

扫一扫