问题描述:给定一串整数,找出其中和最大的连续子数列,包括子数列的位置和最大和。
给定整数序列:{0, -3, 6, 8, -20, 21, 8, -9, 10, -1, 3, 6, 5}
其中和最大的连续子数列为:{21, 8, -9, 10, -1, 3, 6, 5}
【PS】
如果序列里都是负数的话,本文的算法返回最大的负数。有一种思想是,如果所有输入数据都是负数,则最大连续子数列为空,值为0,类似空集是任意集合的子集。
【暴力搜索】
依次以序列的每一个数为子数列的开头,遍历所有的情况,时间复杂度为o(n*n)。
- //o(n*n)
- void MaxSubSet_1(int nums[],int length)
- {
- if (length == 0)
- return;
- int start = 0;
- int end = 0;
- int maxSum = nums[0];
- int sum;
- for (int i = 0; i < length; i++)
- {
- sum = nums[i];
- for (int j = i; j < length; j++)
- {
- sum +=nums[j];
- if (sum > maxSum)
- {
- start = i;
- end = j;
- maxSum = sum;
- }
- }
- }
- cout << "Max:" << maxSum <<" ( " << start <<", " << end <<" )" << endl;
- }
【线性算法】
此算法基于以下两个定理:
1)
2)
故如果出现S(i,j)<0,应当跳到j+1,和置为0
时间复杂度为o(n)。
这个算法是基于两个结论得来的。
1. 如果数列A的某个子列A(i, j) 的和S(i, j) < 0, 那么A(i, q) (q > j) 肯定不是数列A的最大递增子列。
S(i, q) = S(i, j) + S(j+1, q) < 0 + S(j+1, q) = S(j+1, q)
这个结论说明,从位置 i 开始的子列,一旦遇到和为0的子列,后面可以不搜索了,直接从 j+1 开始重新计算。
2. 如果A(i, j) 是数列A以 i 起始的子列中第一个和S(i, j) < 0 的,则对任意 i <= p <= j, p<= q,A(p, q) 的和 S(p, q) 要么小于最大连续子列和,要么与现存的最大连续子列和相等。所以A(p, q)序列可以跳过。
因为S(i ,j) 是第一个<0 的,所以S(i, p-1)必然>=0,则 S(p, q) = S(i, q) - S(i, p-1) <= S(i, q)
i p j q
---|-----|-------|------|---------------------
- 当 q > j 时,由结论1得知, S(i, q) < S(j+1, q),则 S(p, q) < S(j+1, q)
i p q j
---|-----|-------|------|---------------------
- 当q <= j 时,(这个暂时不会证明。。。)
- //o(n)
- void MaxSubSet_2(int nums[],int length)
- {
- if (length == 0)
- return;
- int start = 0;
- int sum = nums[0];
- int maxStart = 0;
- int maxEnd = 0;
- int maxSum = nums[0];
- for (int i = 1; i < length; i++)
- {
- sum += nums[i];
- if (sum > maxSum)
- {
- maxStart = start;
- maxEnd = i;
- maxSum = sum;
- }
- if (sum < 0)
- {
- start = i + 1;
- sum = 0;
- }
- }
- cout << "Max: " << maxSum << " ( " << maxStart <<", " << maxEnd <<" )" << endl;
- }
【分治算法】
分治算法将一个复杂的问题分解成一个个相似的简单的问题,先解决规模较小的问题,然后通过适当的组合来解决复杂的问题。特别适用于目前日渐流行的多核处理器,每个核分别同时计算小问题,再汇总结果,实现算法的并行化。
1. 规模分解
把问题的操作数集合分为2个部分,对两个子数据集合分别操作,最后进行归并。而子数据集合又可以细分成更小的数据集,用递归来实现最合适啦。
把序列 A 均分为前后两个部分 A1 和 A2, 假设我们已经找到了A1和A2的最大连续数列,那么 A 的最大连续数列:
- 全部在A1中
- 全部在A2中
- A1的后半部+A2的前半部
时间复杂度o(nlogn)
- //o(nlogn)
- void MaxSubSet_3(int nums[],int begin,int length,int& start,int& end,int& maxSum)
- {
- if (length == 0)
- {
- start = 0;
- end = 0;
- maxSum = 0;
- return;
- }
- if (length == 1)
- {
- start = begin;
- end = begin;
- maxSum = nums[begin];
- return;
- }
- int start_1, end_1, maxSum_1;
- int start_2, end_2, maxSum_2;
- int start_3, end_3, maxSum_3;
- int headSum, tailSum, sum;
- int len_1 = length / 2;
- MaxSubSet_3(nums, begin, len_1, start_1, end_1, maxSum_1);
- MaxSubSet_3(nums, begin+len_1, length - len_1, start_2, end_2, maxSum_2);
- //Compute the max sum of the first half of array
- sum = nums[len_1-1];
- headSum = nums[len_1-1];
- start_3 = len_1-1;
- for(int i = len_1-2; i>=begin; i--)
- {
- sum += nums[i];
- if (sum > headSum)
- {
- headSum = sum;
- start_3 = i;
- }
- }
- //Compute the max sum of the second half of array
- sum = nums[len_1];
- tailSum = nums[len_1];
- end_3 = len_1;
- for (int i = len_1+1; i < length;i++)
- {
- sum += nums[i];
- if (sum > tailSum)
- {
- tailSum = sum;
- end_3 = i;
- }
- }
- maxSum_3 = headSum + tailSum;
- if (maxSum_1 > maxSum_2)
- {
- start = start_1;
- end = end_1;
- maxSum = maxSum_1;
- }
- else
- {
- start = start_2;
- end = end_2;
- maxSum = maxSum_2;
- }
- if (maxSum < maxSum_3)
- {
- start = start_3;
- end = end_3;
- maxSum = maxSum_3;
- }
- }
2. 递推式分解
实际上是数学归纳法。如果知道了规模为 n-1 的最大子数列,现在在这个子列后面多加一个蒜素,如何根据现有的结果得到规模为 n 的最大子数列。在这里,递推式分解是规模分解的一个特例,把问题分为了n-1 和 1 两个部分。也有3种情况:
- 全部在n-1的数列中
- 就是最后一个数
- n-1的数列的后缀+最后一个数
时间复杂度o(n)。