求数组的子数组之和的最大值是在《编程之美》上的一道题,觉得挺有意思,就写下此文,也便于自己以后温习。
这道题的解法有很多种,比较容易想到的方法有枚举法,就是把所有的子数组长度的和都计算一遍,求出其中的最大值。这种算法的时间复杂度是O(n^2);还有分治法,就是将数组分为一半一半,那么最大和=Max(左半边的最大和,右半边的最大和,左右两边衔接处所所构成的最大和),其解的示意图如下所示。
这种解法的复杂度为O(nlogn)。当然,看过这本书的人,一定会知道其实还有一种更为简便的方法。
这种解法只需要扫描一遍数组,就可以得到答案。我们需要两个辅助变量来完成这个过程:MaxEndHere和MaxLen。其中MaxEndHere表示从扫描点开始相加所能获得的最大和,而MaxLen表示从数组一端到扫描点处,所能获得的最大连续和,这两个变量的关系如下图:
从这张图可以看出,随着数组元素的扫描,MaxEndHere有可能转化为MaxLen(因为MaxEndHere也是连续子数组之和,该值在扫描时可能大于之前计算得到的MaxLen)。新的MaxEndHere=之前的MaxEndHere+Array[i],i为扫描点,在得到新的MaxEndHere后,其值可能大于MaxLen,从而成为新的MaxLen。这样,得到第一组关系式:
1)新的MaxEndHere=之前的MaxEndHere+Array[i]
2)MaxSum=新的MaxEndHere>MaxSum ? 新的MaxEndHere:MaxSum
另外,还有一种情况不能忽略,那就是当之前的MaxEndHere小于0时,根据上面的关系式,我们可以看到相加之后,新的MaxEndHere=之前MaxEndHere+Array[i] < Array[i],那么此时应当有MaxEndHere=Array[i],所以,还应当增加一组关系式:
3)新的MaxEndHere=新的MaxEndHere > Array[i]? 新的MaxEndHere:Array[i]
我们将上述两组关系式综合一下,得到新的关系式:
1)新的MaxEndHere=之前的MaxEndHere+Array[i]
2)新的MaxEndHere=新的MaxEndHere > Array[i]? 新的MaxEndHere:Array[i]
3)MaxSum=新的MaxEndHere>MaxSum ? 新的MaxEndHere:MaxSum
有了这三组关系式,就可以写出程序了,很明显,这种解法的时间复杂度是O(n)。
int get_max(int *A,int n) { int MaxEndHere=0,MaxSum=0; for(int i=n-1;i>=0;i--) { MaxEndHere=MaxEndHere+A[i]; MaxEndHere=MaxEndHere > A[i] ? MaxEndHere:A[i]; MaxSum=MaxEndHere > MaxLen ? MaxEndHere:MaxSum; } return MaxSum; }
二维数组的情况
现在将其扩展为二维数组,其问题变成求解子矩形中的最大和,如下图所示:
我们希望能够利用一维数组的中O(n)的解法来帮助我们解决这个问题,那么是否可行呢?
答案自然是可行的,我们需要做的是将二维数组“合并”成一维数组。如下图将两个相邻的行数组”合并“成一个一维的数组。
同理,可以合并n个相邻的一维数组,得到合并后的一维数组。
得到一维数组后,就可以使用一维数组的求解方法,得到从Start到End的范围内所能得到的最大和。设二维数组的大小是N(行) * M(列),那么Start的取值范围为[0,N],而End的范围为[Start,N],枚举所有可行的(Start,End)对,将这区间内的二维数组合并为一维数组,就可以求得该(Start,End)取值对下的最大和。由此可写出整个过程的代码:
int get_max_2D(int **Matrix,int N,int M) { int MergeArray[M]; int MaxSum=0; for(int Start=0;Start <= N;Start++) { memset(MergeArray,0,M * sizeof(int));//合并数组置0 for(int End=Start;End <= N;End++) { for(int i=0;i < M;i++) MergeArray[i]+=Matrix[End][i];//获得合并数组 int CurSum=get_max(MergeArray,M);//使用一维数组的求解方法 MaxSum=CurSum > MaxSum ? CurSum:MaxSum; } } return MaxSum; }
我们看到合并数组和求解一维数组的最大和的时间复杂度都是O(M),整个过程一共需要循环O(N^2)次,因此复杂度为O(M*N^2)。