算法导论------递归算法的时间复杂度求解

最新推荐文章于 2024-05-12 20:47:03 发布

GNG

最新推荐文章于 2024-05-12 20:47:03 发布

阅读量7.8w

点赞数 94

分类专栏：算法导论《算法导论》笔记文章标签：递归算法时间复杂度分析算法导论

本文链接：https://blog.csdn.net/so_geili/article/details/53444816

版权

算法导论同时被 2 个专栏收录

10 篇文章

订阅专栏

《算法导论》笔记

8 篇文章

订阅专栏

1.算法设计与分析概述

在总结递归算法的时间复杂度分析之前，应该明确几组概念。
算法仅仅是求解问题的解决方案，这个解决方案本身并不是问题的答案，而是能获得答案的指令序列。只有通过执行算法才可以获得求解问题的答案。
从算法是否递归调用的角度看，算法可以分为非递归算法和递归算法。
非递归算法时间复杂度分析较为简单，通常是计算算法中基本语句执行次数，一般都是一个关于问题规模n的表达式，然后用渐近符号 $Θ、Ο、o、Ω、ω$ 表示出算法的时间复杂度。
递归算法是采用分治的方法，把一个“大问题”分解出若干个相似的“小问题”求解。在分析算法复杂度时，关键是根据递归过程建立递推关系式，然后求解递推关系式，得到算法执行的时间表达式（一般都与问题规模n相关），最后用渐近符号 $Θ、Ο、o、Ω、ω$ 表示出算法的时间复杂度。
在《算法导论》、《算法设计与分析》这2门课中，我们已经学习一些通用的算法设计技术，如增量法、分治法、贪心法、动态规划、线性规划、回溯法、分支限界法等；在算法设计完成后，对算法的复杂度进行分析是必然的，所以本篇的中心将围绕算法时间复杂度展开。

2.非递归算法分析

例1：如果算法的执行时间不随着问题规模n的增加而增长，它的基本语句执行的次数是固定的，总的时间由一个常数来限界。此类算法的时间复杂度是O(1)。
例2：当有若干个循环语句时，时间复杂度是由嵌套层数最多的循环语句中的基本语句的执行次数决定。如下

void fun(int n){
    int x=0;
    for(int i=1;i<=n;i++){
        for(int j=1;j<=i;j++){
            for(int k=1;k<=j;k++){
                x++;             //基本语句
            }
        }
    }
}

解：该算法的基本语句是x++;所以
$f(n)=\sum\limits_{i=1}^n\sum\limits_{j=1}^{i}\sum\limits_{k=1}^{j}1=\sum\limits_{i=1}^n\sum\limits_{j=1}^{i}j=\sum\limits_{i=1}^n\frac{i(i+1)}{2}=....=O(n^3)$ ，时间复杂度为 $O(n^3)$ 。

虽然非递归算法的时间复杂度比较好分析，但往往需要用到多项式的求和技巧和放缩技巧，如：

等差数列 $\left\{a_k\right\}$ 求和： $\sum\limits_{k=1}^na_k=\frac{n(a_1+a_n)}{2}$
等比数列 $\left\{aq^k\right\}$ 求和： $\sum\limits_{k=0}^naq^k=\frac{a(1-q^{n+1})}{1-q}$
调和级数 $\left\{ \frac{1}{k} \right\}$ 求和： $\sum\limits_{k=1}^n\frac{1}{k}=lnn+O(1)$ （需要用微积分知识证明）
对数级数 $\lg 1+\lg 2+...+\lg n=\lg(n!)=Θ(n\lg n)$ （利用Stirling公式证明）
放缩1：用序列中的最大项代替序列中的每个项，这种方法可以表示为： $\sum\limits_{k=1}^na_k≤na_{max}$
放缩2：在等比数列中，假设存在常数 $r<1$ ，使得 $\frac{a_{k+1}}{a_k}≤r$ 对一切 $k≥0$ 成立，那么有： $\sum k = 0 n a k \leq \sum k = 0 \infty a 0 r k = a 0 \sum k = 0 \infty r k = a 0 1 - r$ $\sum\limits_{k=0}^na_k≤\sum\limits_{k=0}^∞a_0r^k=a_0\sum\limits_{k=0}^∞r^k=\frac{a_0}{1-r}$
放缩3：对每个b>1和每个a>0，都有 $\log_bn=o(n^a)$
$1+3+5+...+(2n-1)=n^2$
$1^2+2^2+3^2+...+n^2=\frac{1}{6}n(n+1)(2n+1)=O(n^3)$ （幂方级数，上限比幂次高出一阶）
$1^3+2^3+3^3+...n^3=\left[ \frac{1}{2} n(n+1)\right]^2=O(n^4)$
各种收敛级数，不再一一列举。

小结：以上这些求和及放缩技巧在下面的递归树求总代价、主定理证明过程中也要用到，非常的重要！

3.递归算法分析

3.1利用数列知识

累加法：递推关系式为 $a_{n+1}-a_{n}=f(n)$ 采用累加法。
累乘法：递推关系式为 $\frac{a_{n+1}}{a_{n}}=f(n)$ 采用累乘法。
构造法：递推关系式为(1) $a_{a+1}=pa_n+q$ ，(2) $a_{a+1}=pa_n+q^n$ ，都可以通过恒等变形，构造出等差或等比数列，利用等差或等比数列的定义进行解题，其中的构造方法可通过待定系数法来进行。
和化项法：递推公式为 $S_n=f(n)$ 或 $S_n=f(a_n)$ 一般利用 $a n = {S 1 ， S n - S n - 1 ，当 n = 1 当 n > = 2$ $a_n= \begin{cases} S_1，&当n=1\\ S_n-S_{n-1}，&当n>=2 \end{cases}$
用特征方程求解递推方程（感觉比较生僻，不做解释）
迭代法： 从原始递推方程开始，反复将对于递推方程左边的函数用右边的等式代入，直到得到初值，然后将所得的结果进行化简。
例如在调用归并排序mergeSort(a,0,n-1)对数组 $a[0...n-1]$ 排序时，执行时间 $T(n)$ 的递推关系式为： $T (n) = {O (1) ， 2 T (n 2) + O (n) ，当 n = 1 当 n > = 2$ $T{(n)}= \begin{cases} O(1)， & 当 n=1\\ 2T(\frac{n}{2})+O(n)，&当n>=2 \end{cases}$
其中， $O(n)$ 为merge()所需要的时间，设为 $cn$ （c为正常量）。因此：
$T (n) = 2 T (n 2) + c n = 2 (2 T (n 4) + c n 2) + c n = 22 T (n 4) + 2 c n = 23 T (n 8) + 3 c n = . . . = 2 k T (n 2 k) + k c n = n O (1) + c n log 2 n = O (n log 2 n), (假设 n = 2 k, 则 k = log 2 n)$ $\begin{split} T(n)&=2T(\frac{n}{2})+cn=2(2T(\frac{n}{4})+\frac{cn}{2})+cn=2^2T(\frac{n}{4})+2cn\\ &=2^3T(\frac{n}{8})+3cn=...=2^kT(\frac{n}{2^k})+kcn\\ &=nO(1)+cn\log_2n\\ &=O(n\log_2n),(假设n=2^k,则k=\log_2n) \end{split}$

忽略求解细节。在我们求解递归式时，因为最终是要求得一个时间上限，所以在求解时常常省略一些细节。比如mergeSort(a,0,n-1)运行时间的实际递归式应该是：

T (n) = ⎧ ⎩ ⎨ O (1) ， T (⌈ n 2 ⌉) + T (⌊ n 2 ⌋) + O (n) ， 当 n = 1 当 n > = 2

$T{(n)}= \begin{cases} O(1)， & 当 n=1\\ T(\left \lceil \frac{n}{2}\right\rceil)+T(\left \lfloor \frac{n}{2}\right\rfloor)+O(n)，&当n>=2 \end{cases}$
但我们忽略这些上取整、下取整以及边界条件，甚至假设问题规模

n=2k $n=2^k$ ，这都是为方便求解而忽略的细节。经验和一些定理告诉我们，这些细节不会影响算法时间复杂度的渐近界。

类似的，我们也可以用迭代法求解汉诺塔递归求解时的时间复杂度。但遗憾的是，迭代法一般适用于一阶的递推方程。对于二阶及以上（即 $T(n)依赖它前面更多个递归项$ ）的递推方程，迭代法将导致迭代后的项太多，从而使得求和公式过于复杂，因此需要将递推方程化简，利用差消法等技巧将高阶递推方程化为一阶递推方程。如在求快速排序算法平均时间复杂度 $T(n)$ 的递推方程， $T(n)$ 依赖 $T(n-1)、T(n-2)、...、T(1)$ 等所有的项，这样的递推方程也称为全部历史递推方程。（这里省略快速排序算法平均复杂度T(n)的求解过程）

小结：上面6种递推关系是高中、本科知识，在此重点介绍了迭代法，其它几种方法虽未在本篇中使用，但可以加深对递推式求解的认识。

3.2代入法

代入法实质上就是数学归纳法，因此求递推式分为两步：

猜测解的形式；
用数学归纳法求出解中的常数，并证明解是正确的。

遗憾的是并不存在通用的方法来猜测递归式的正确解，需要凭借经验，偶尔还需要创造力。即使猜出了递归式解的渐近界，也有可能在数学归纳证明时莫名其妙的失败。正是由于该方法技术细节较为难掌握，因此这个方法不适合用来求解递归方程，反而比较适合作为其他方法检验手段。在此不做总结。可以翻阅《算法导论》进行学习。

3.3递归树

递归树是一棵结点带权值的树。初始的递归树只有一个结点，它的权标记为 $T(n)$ ；然后按照递归树的迭代规则不断进行迭代，每迭代一次递归树就增加一层，直到树中不再含有权值为函数的结点（即叶结点都为 $T(1)$ ）。下面以递归方程

T (n) = {O (1) ， 2 T (n 2) + O (n) ， 当 n = 1 当 n > = 2; (假 设 n = 2 k, 则 k = log 2 n)

$T{(n)}= \begin{cases} O(1)， & 当 n=1\\ 2T(\frac{n}{2})+O(n)，&当n>=2 ;(假设n=2^k,则k=\log_2n)\end{cases}$ 来讲述递归树的迭代规则。

第一步： 把根结点 $T(n)$ 用根是 $cn$ 、左结点为 $T(\frac{n}{2})$ 、右结点为 $T(\frac{n}{2})$ 的子树代替（即：以分解、合并子问题需要的代价为根，分解得到的子问题为叶的子树。其中常量c代表求解规模为1的问题所需的时间）；（如下如 $(a)\rightarrow(b)$ ）
第二步：把叶结点按照“第一步”的方式展开； $T(\frac{n}{2})$ 用根是 $cn/2$ 、左节点为 $T(\frac{n}{4})$ 、右结点为 $T(\frac{n}{4})$ 的子树代替。（如下如 $(b)\rightarrow(c)$ ）
第三步：反复按照“第一步”的方式迭代，每迭代一次递归树就增加一层，直到树中不再含有权值为函数的结点（即叶结点都为 $T(1)$ ）。（如下如 $(c)\rightarrow(d)$ ）

在得到递归树后，将树中每层中的代价求和，得到每层代价，然后将所有层的代价求和，得到所有层次的递归调用的总代价。在上图(d)部分中，完全展开的递归树高度为 $\lg n$ (树高为根结点到叶结点最长简单路径上边的数目)，所有递归树具有 $\lg n+1$ 层，所以总代价为 $cn*(\lg n+1)$ ，所有时间复杂度为 $Θ(n\lg n)$ 。

总结：递归树模型求解递归方程，本质上就是迭代思想的应用，利用递归方程迭代展开过程构造对应的递归树，然后把每层的时间代价进行求和。不过递归树模型更直观，同时递归树也克服了二阶及更高阶递推方程不方便迭代展开的痛点。

3.4主方法求解递推式

主方法为如下形式的递归式提供了一种“菜谱”式的求解方法，如下所示

T (n) = a T (n / b) + f (n)

$T(n)=aT(n/b)+f(n)$

其中 $a≥1$ 和 $b>1$ 是常数， $f(n)$ 是渐近正函数。这个递推式将规模为n的问题分解为a个子问题，每个子问题的规模为 $n/b$ ，a个子问题递归地求解，每个花费时间 $T(n/b)$ 。函数 $f(n)$ 包含了问题分解和子问题解合并的代价。同样，这个递归式也没有考虑上取整、下取整、边界条件等，结果不会影响递归式的渐近性质。

定理4.1(主定理) 令a≥1和b>1是常数， $f(n)$ 是一个函数， $T(n)$ 是定义在非负整数上的递归式：

$T (n) = a T (n / b) + f (n)$ $T(n)=aT(n/b)+f(n)$
其中我们将 $n/b$ 解释为 $\left \lfloor n/b\right\rfloor$ 或 $\left \lceil n/b\right\rceil$ 。那么 $T(n)$ 有如下渐近界：
1. 若对某个常数 $ε>0$ 有 $f(n)=O(n^{(\log_b{a})-ε})$ ，则 $T(n)=Θ(n^{\log_ba})$
2. 若 $f(n)=Θ(n^{\log_b{a}})$ ，则 $T(n)=Θ(n^{\log_ba}\lg n)$ 。
3. 若对某个常数 $ε>0$ 有 $f(n)=Ω(n^{(\log_b{a})+ε})$ ，且对某个常数 $c<1$ 和所有足够大的n有 $af(n/b)≤cf(n)$ ，则 $T(n)=Θ(f(n))$

在使用主定理之前，要比较 $f(n)和(n^{\log_b{a}})$ 的大小，这个大小不是算术意义上的大小比较，而是要在多项式意义上比较。以上三种情况在多项式意义上并未覆盖 $f(n)$ 的所有可能性。情况1和情况2之间有一定间隙；情况2和情况3之间也有一定间隙。如果f(n)落在这两个间隙中，或者情况3中正则条件不成立，就不能使用主方法来求递归式。
如在递归式： $T(n)=2T(n/2)+n\lg n$ 中，因为 $n^{\log_b{a}}=n<f(n)=n\lg n$ ，但是 $f(n)$ 并不大于n一个多项式因子 $n^ε$ ,因为对于给定的 $ε>0$ 当n足够大时，均有 $n^ε>\lg n$ 。所以找不到这样 $ε>0$ ，该递归式落入了情况2和情况3之间的间隙，不能使用主定理。
最后给出主定理应用的几个练习题：