问题是这样的:一个整数数组中的元素有正有负,在该数组中找出一个连续子数组,要求该连续子数组中各元素的和最大,这个连续子数组便被称作最大连续子数组。比如数组{2,4,-7,5,2,-1,2,-4,3}的最大连续子数组为{5,2,-1,2},最大连续子数组的和为5+2-1+2=8。
下面按照时间复杂度逐步优化的顺序依次给出这三种算法。
暴力求解法
该方法的思想非常简单,先找出从第1个元素开始的最大子数组,而后再从第2个元素开始找出从第2个元素开始的最大子数组,依次类推,比较得出最大的子数组。实现代码如下:
-
-
-
-
-
-
- int MaxSubSum1(int *arr,int len)
- {
- int i,j;
- int MaxSum = 0;
-
- for(i=0;i<len;i++)
- {
- int CurSum = 0;
-
- for(j=i;j<len;j++)
- {
- CurSum += arr[j];
- if(CurSum > MaxSum)
- MaxSum = CurSum;
- }
- }
- return MaxSum;
- }
很明显地可以看出,该方法的时间复杂度为O(n*n)。
分治求解法
考虑将数组从中间分为两个子数组,则最大子数组必然出现在以下三种情况之一:
1、完全位于左边的数组中。
2、完全位于右边的数组中。
3、跨越中点,包含左右数组中靠近中点的部分。
递归将左右子数组再分别分成两个数组,直到子数组中只含有一个元素,退出每层递归前,返回上面三种情况中的最大值。实现代码如下:
-
-
-
- int Max3(int a,int b,int c)
- {
- int Max = a;
- if(b > Max)
- Max = b;
- if(c > Max)
- Max = c;
- return Max;
- }
-
-
-
-
- int MaxSubSum2(int *arr,int left,int right)
- {
- int MaxLeftSum,MaxRightSum;
- int MaxLeftBorderSum,MaxRightBorderSum;
- int LeftBorderSum,RightBorderSum;
- int i,center;
-
-
- if(left == right)
- if(arr[left]>0)
- return arr[left];
- else
- return 0;
-
-
- center = (left + right)/2;
- MaxLeftBorderSum = 0;
- LeftBorderSum = 0;
- for(i=center;i>=left;i--)
- {
- LeftBorderSum += arr[i];
- if(LeftBorderSum > MaxLeftBorderSum)
- MaxLeftBorderSum = LeftBorderSum;
- }
- MaxRightBorderSum = 0;
- RightBorderSum = 0;
- for(i=center+1;i<=right;i++)
- {
- RightBorderSum += arr[i];
- if(RightBorderSum > MaxRightBorderSum)
- MaxRightBorderSum = RightBorderSum;
- }
-
-
- MaxLeftSum = MaxSubSum2(arr,left,center);
- MaxRightSum = MaxSubSum2(arr,center+1,right);
-
-
- return Max3(MaxLeftSum,MaxRightSum,MaxLeftBorderSum+MaxRightBorderSum);
- }
-
-
-
-
- int MaxSubSum2_1(int *arr,int len)
- {
- return MaxSubSum2(arr,0,len-1);
- }
设该算法的时间复杂度为T(n),则:
T(n)= 2T(n/2)+ O(n),且T(1)= 1。
逐步递推得到时间复杂度T(n)= O(nlogn)。
线性时间算法
该算法在每次元素累加和小于0时,从下一个元素重新开始累加。实现代码如下:
-
-
-
-
-
- int MaxSubSum3(int *arr,int len)
- {
- int i;
- int MaxSum = 0;
- int CurSum = 0;
- for(i=0;i<len;i++)
- {
- CurSum += arr[i];
- if(CurSum > MaxSum)
- MaxSum = CurSum;
-
-
-
- if(CurSum < 0)
- CurSum = 0;
- }
- return MaxSum;
- }
显然,该算法的时间复杂度O(n)。该算法理解起来应该不难,但是要想出来可就不容易了。另外,该算法的一个附带的有点是:它只对数据进行一次扫描,一旦元素被读入并被处理,它就不再需要被记忆。因此,如果数组在磁盘或磁带上,他就可以被顺序读入,在主存中不必存储数组的任何部分。不仅如此,在任意时刻,该算法都能对它已经读入的数据给出最大子数组(另外两种算法不具有这种特性)。具有这种特性的算法叫做联机算法。
一道经典的面试笔试题目。
第一种解法,遍历每种情况,算法复杂度为O(N^2)。
- int maxSubarray1(int *A,int length)
- {
- int maxSum=A[0];
- int temp;
- for (int i=0;i<length;i++)
- {
- temp=0;
- for (int j=i;j<length;j++)
- {
- temp=temp+A[j];
- if (temp>maxSum)
- {
- maxSum=temp;
- }
- }
- }
- return maxSum;
- }
第二种解法,利用二分法。把数组分为两段,最大子数组出现在1、左半段。2、右半段。3、横跨左右两半段。算法复杂度为O(NlogN)。
- int MaxThree(int a, int b, int c)
- {
- int temp = a>b? a: b;
- return temp>c? temp : c;
- }
- int maxSubArray2(int *A,int start,int end)
- {
- if (start==end)
- {
- return A[start];
- }
- int mid=(start+end)/2;
-
-
- int maxLeftSum=A[mid];
- int temp=0;
- for (int k=mid;k>=start;k--)
- {
- temp=temp+A[k];
- if (temp>maxLeftSum)
- {
- maxLeftSum=temp;
- }
- }
-
- int maxRightSum=A[mid+1];
- temp=0;
- for (int k=mid+1;k<=end;k++)
- {
- temp=temp+A[k];
- if (temp>maxRightSum)
- {
- maxRightSum=temp;
- }
- }
- return MaxThree(maxLeftSum+maxRightSum,maxSubArray2(A,start,mid),maxSubArray2(A,mid+1,end));
- }
第三种解法,只需要扫描一遍数组即可。在扫描过程中,记录连续子数组和,如果小于零,则重新开始记录。在记录过程中,找到最大的。算法复杂度为O(N)。
- int maxSubArray3(int *A,int len)
- {
- int maxSum=A[0];
- int temp=0;
- for (int k=0;k<len;k++)
- {
- temp=temp+A[k];
- if (temp>maxSum)
- {
- maxSum=temp;
- }
- if (temp<0)
- {
- temp=0;
- }
- }
- return maxSum;
- }
测试代码:
- int main()
- {
- int A[]={4, -3, 2 ,-2 ,4 , -7, 6 , -2 ,7 ,-5 ,8 , -7, 3};
- int len=sizeof(A)/sizeof(int);
- cout<<maxSubarray1(A,len)<<endl;
- cout<<maxSubArray2(A,0,len-1)<<endl;
- cout<<maxSubArray3(A,len);
- return 0;
- }