算法导论 — 4.1 最大子数组问题

最新推荐文章于 2023-03-25 20:21:44 发布

yangtzhou

最新推荐文章于 2023-03-25 20:21:44 发布

阅读量1.7k

点赞数 1

分类专栏：算法导论文章标签：算法导论 4.1 最大子数组问题

本文链接：https://blog.csdn.net/yangtzhou/article/details/104910911

版权

算法导论专栏收录该内容

61 篇文章 128 订阅

订阅专栏

笔记

本节给出了分治法的一个例子。给定一个数组 $A [1 . . n]$ ，找出一个元素和为最大的连续子数组 $A [i . . j]$ ，其中 $1 \leq i \leq j \leq n$ ，称这样的子数组为最大子数组。例如，下图所示数组中，第 $8$ 个元素到第 $11$ 个元素之间的子数组为最大子数组。
　　在这里插入图片描述
　　求解最大子数组问题，最简单的方法是暴力检查所有的子数组，从中找出和为最大的子数组。对于一个有 $n$ 个元素的数组，一共有 $C_n^2+C_n^1=n(n-1)/2+n=Θ(n^2)$ 个子数组。参考练习4.1-2可知，计算每个子数组的和只需要 $O (1)$ 时间。因此暴力求解法的所花费的时间为 $Θ(n^2)$ 。
　　除了暴力求解法，最大子数组问题还可以使用分治法求解，并且分治法具有更优的时间复杂度。假定要寻找子数组 $A [l o w . . h i g h]$ 的最大子数组，我们从中央位置 $m i d = ⌊ (l o w + h i g h) / 2 ⌋$ 将 $A [l o w . . h i g h]$ 划分为两个子数组， $A [l o w . . m i d]$ 和 $A [m i d + 1 . . h i g h]$ 。于是， $A [l o w . . h i g h]$ 的任何一个子数组 $A [i . . j]$ 必然是以下三种情况之一：
　　• 完全位于子数组 $A [l o w . . m i d]$ 中，即 $l o w \leq i \leq j \leq m i d$ 。
　　• 完全位于子数组 $A [m i d + 1 . . h i g h]$ 中，即 $m i d < i \leq j \leq h i g h$ 。
　　• 跨越了中央位置 $m i d$ ，即 $l o w \leq i \leq m i d < j \leq h i g h$ 。
　　根据以上分析，可以递归求解最大子数组问题。对于一个子数组 $A [l o w . . h i g h]$ ，首先寻找跨越中央位置的最大子数组，然后分别递归求解 $A [l o w . . m i d]$ 和 $A [m i d + 1 . . h i g h]$ 的最大子数组，比较这三种情况的最大子数组，从中选出元素和最大者作为 $A [l o w . . h i g h]$ 的最大子数组。
　　分治法的关键在于寻找跨越中央位置的最大子数组。对于一个子数组 $A [l o w . . h i g h]$ ，任何跨越中央位置 $m i d$ 的子数组必然都由两个子数组 $A [i . . m i d]$ 和 $A [m i d + 1 . . j]$ 组成，其中 $l o w \leq i \leq m i d$ 并且 $m i d < j \leq h i g h$ 。因此，我们只需要找出形如 $A [i . . m i d]$ 和A $[m i d + 1 . . j]$ 的最大子数组，然后将二者合并即可。下面给出寻找跨越中央位置的最大子数组的伪代码。
　　在这里插入图片描述
　　接下来给出分治法求解最大数组问题的伪代码。
　　
　　要寻找数组 $A [1 . . n]$ 的最大子数组，只需要调用FIND-MAXIMUM -SUBARRAY $(A, 1, n)$ 即可。
　　下面分析分治法求解最大子数组问题的时间复杂度。对于长度为 $n$ 的数组，求解最大子数组的时间用 $T (n)$ 表示。 $T (n)$ 由三部分组成：
　　• 递归求解子数组 $A [1 . . m i d]$ 的最大子数组的时间 $T (n / 2)$ ；
　　• 递归求解子数组 $A [m i d + 1 . . n]$ 的最大子数组的时间 $T (n / 2)$ ；
　　• 求解跨越中央位置的最大子数组的时间，这一时间为 $Θ (n)$ 。
　　所以有递归式 $T (n) = 2 T (n / 2) + Θ (n)$ 。求解这个递归式，得到 $T (n) = Θ (n l g n)$ 。

练习

4.1-1 当 $A$ 的所有元素均为负数时，FIND-MAXIMUM-SUBARRAY返回什么？
　　解
　　返回数值最大的那个负数，即绝对值最小的负数。
　　
4.1-2 对最大子数组问题，编写暴力求解方法的伪代码，其运行时间应该为 $Θ(n^2)$ 。
　　解
　　在这里插入图片描述
　　
4.1-3 当你的计算机上实现最大子数组问题的暴力算法和递归算法。请指出多大的问题规模 $n_0$ 是性能交叉点——从此之后递归算法将击败暴力算法？然后，修改递归算法的基本情况——当问题规模小于 $n_0$ 时采用暴力算法。修改后，性能交叉点会改变吗？
　　略

4.1-4 假定修改最大子数组问题的定义，允许结果为空子数组，其和为 $0$ 。你应该如何修改现有算法，使它们能允许空子数组为最终结果？
　　解
　　先对整个数组遍历一遍，检查是否所有元素都为负数。如果所有元素都为负数，则算法输出空子数组。如果数组中存在正数，则调用FIND-MAXIMUM –SUBARRAY求解。

4.1-5 使用如下思想为最大子数组问题设计一个非递归的、线性时间的算法。从数组的左边界开始，由左至右处理，记录到目前为止已经处理过的最大子数组。若已知 $A [1 . . j]$ 的最大子数组，基于如下性质将解扩展为 $A [1 . . j + 1]$ 的最大子数组： $A [1 . . j + 1]$ 的最大子数组要么是 $A [1 . . j]$ 的最大子数组，要么是某个形如 $A [i . . j + 1]$ 的最大子数组 $(1 \leq i \leq j + 1)$ 。在已知形如 $A [i . . j]$ 的最大子数组的情况下，可以在常数时间内找出形如 $A [i . . j + 1]$ 的最大子数组。
　　解
　　与分治法不同，这是典型的增量法。本题的关键在于：在已知以 $A [j]$ 结尾的最大子数组的情况下，找出以 $A [j + 1]$ 结尾的最大子数组。假设以 $A [j]$ 结尾的最大数组为 $A [i . . j] (1 \leq i \leq j)$ 。分两种情况：
　　(1) 如果 $A [i . . j]$ 各元素之和 ${\rm sum}\{A[i..j]\} > 0$ ，那么以 $A [j + 1]$ 结尾的最大数组为 $A [i . . j + 1]$ 。这一点可以用反证法来说明。假设以 $A [j + 1]$ 结尾的最大数组为 $A [k . . j + 1]$ ，其中 $1 \leq k \leq j + 1$ 并且 $k \neq = i$ 。又分两种情况讨论。
　　1) $1 \leq k \leq j$ ：由于以 $A [j]$ 结尾的最大子数组为 $A [i . . j]$ ，所以 ${\rm sum}\{A[k..j]\} ≤ {\rm sum}\{A[i..j]\}$ ，从而有 ${\rm sum}\{A[k..j+1]\} ≤ {\rm sum}\{A[i..j+1]\}$ 。如果 ${\rm sum}\{A[k..j+1]\} < {\rm sum}\{A[i..j+1]\}$ ，那么 $A [k . . j + 1]$ 肯定不是以 $A [j + 1]$ 结尾的最大数组，这与假设矛盾。如果 ${\rm sum}\{A[k..j+1]\} = {\rm sum}\{A[i..j+1]\}$ ，那么如果假设成立，即 $A [k . . j + 1]$ 是以 $A [j + 1]$ 结尾的最大数组，那么 $A [i . . j + 1]$ 也同样是以 $A [j + 1]$ 结尾的最大数组。
　　2) $k = j$ ：此时假设的以 $A [j + 1]$ 结尾的最大数组为 $A [j + 1]$ 本身。由于 ${\rm sum}\{A[i..j]\} > 0$ ，所以 ${\rm sum}\{A[i..j+1]\} > A[j+1]$ 。这说明 $A [j + 1]$ 本身肯定也不是以 $A [j + 1]$ 结尾的最大数组，这与假设矛盾。
　　(2) 如果 $A [i . . j]$ 各元素之和 ${\rm sum}\{A[i..j]\} ≤ 0$ ，那么 $A [j + 1]$ 结尾的最大数组为 $A [j + 1]$ 本身。这一点同样可以用反证法来说明，这里就不赘述。
　　下面给出该算法的伪代码。
　　在这里插入图片描述
　　对于一个包含 $n$ 个元素的数组，该算法一共包含 $n$ 次迭代，每次迭代花费 $Θ (1)$ 时间。因此，该算法的运行时间为 $Θ (n)$ 。
　　
　　本节代码链接：
　　https://github.com/yangtzhou2012/Introduction_to_Algorithms_3rd/tree/master/Chapter04/Section_4.1