【算法证明二】快速排序的时间复杂度分析

最新推荐文章于 2024-04-30 23:53:05 发布

树不懒

最新推荐文章于 2024-04-30 23:53:05 发布

阅读量1.5k

点赞数 2

分类专栏：算法文章标签：算法

本文链接：https://blog.csdn.net/weixin_43233774/article/details/130858163

版权

算法专栏收录该内容

13 篇文章 0 订阅

订阅专栏

快速排序是一种分治算法。选取主元后，将数组使用 partition 算法根据主元分割成两半，再对两半分别进行排序。假设左半边数量为 $q$ ，则右半边数量为 $n - q - 1$ 。则由如下递归式，得到如下运行时间递归式：
$\Theta(n)$

最坏时间复杂度

最坏情况下的复杂度显然是
$T(n)=\max_{0\le q\le n-1}(T(q)+T(n-q-1)) + \Theta(n)$

这里使用代入法(数学归纳法)证明：假设 $\le cn^2$ 成立，代入等式右侧，原式有
$\le c\cdot \max_{0\le q\le n-1}(q^2+(n-q-1)^2) + \Theta(n)$
容易得到， $q^2+(n-q-1)^2$ 在端点取得最大值。因此： $q^2+(n-q-1)^2\le(n-1)^2=n^2-2n+1$ ，即

$\le c(n^2-2n+1) + \Theta(n)\le cn^2$
得到上界为 $O(n^2)$
同理，假设 $\ge cn^2$ ，使用数学归纳法也可以证明 $T(n)=\Omega(n^2)$ ，因此最坏时间复杂度是 $\Theta(n^2)$

期望时间复杂度

通过分析算法代码，可以知道，快速排序的操作主要为

partition 操作数量
partition 内部循环

对于1，易得其 $\le n$ 。对于 2，主要看其内部循环中的比较数量 $X$ 。因此，算法的时间可以表示为 $O (n + X)$ 。其中 $n$ 在这里不重要，凑数用的。
如何计算快排的平均比较次数，即 $E (X)$ ?
设 $X_{ij}$ 为 $i$ 与 $j$ 是否进行了比较，比较为 1，没比较为 0 。因为在快速排序中，两个元素之间最多比较一次（因为元素只与主元比较，而主元不参与后序的递归过程）。因此， $\sum_ {i=1} ^{n-1} \sum_{j=i+1}^n X_{ij}$
对其取期望，得
$\sum_ {i=1} ^{n-1} \sum_{j=i+1}^n E(X_{ij})= \sum_ {i=1} ^{n-1} \sum_{j=i+1}^n P_{ij}, P_{ij} 表示 i j 发生比较的概率$

为方便叙述，设 $Z$ 为原数组集合的重命名， $Z= \{z_1, z_2, ... , z_n\}$ ，其中 $z_i$ 表示数组中第 $i$ 大值（ $Z$ 就是原数组排序后重命名一下）。
如何求 $ij$ 发生比较的概率 $P_{ij}$ 呢？从反向入手，什么时候 $z_iz_j$ 不会发生比较呢？显然当 $z_iz_j$ 之间的某一个 $z_x$ 先被选为主元之后， $z_iz_j$ 被分开了，所以后序的排序过程也一定不会发生比较。如果 $z_i$ 或者 $z_j$ 先被选为元素呢？那么 $z_iz_j$ 会发生比较。如果在 $z_i,z_j]$ 以外的元素被选为主元呢？这并不重要。我们只关心 $z_i, z_j]$ 中的数，谁先被选为主元。

因此， $P_{ij}$ 的计算大大致就清楚了，其等于 $z_i, z_j]$ 中， $i, j$ 先被选为主元的概率，即
$P_{ij}=\frac{1}{j-i+1}+\frac{1}{j-i+1} = \frac{2}{j-i+1}$

代入原公式得
$\sum_ {i=1} ^{n-1} \sum_{j=i+1}^n \frac{2}{j-i+1}$

将 $j - i$ 代换为 $k$ 得
$\sum_ {i=1} ^{n-1} \sum_{k=1}^{n-i} \frac{2}{k+1}<\sum_ {i=1} ^{n-1} \sum_{k=1}^{n-i} \frac{2}{k}=\sum_ {i=1} ^{n-1}O(lgn)=O(nlgn)$