题目描述:
已知一个长度为N的字符串,只由0和1组成, 求一个最长的子串,要求该子串出0和1出现的次数相等。
要求算法时间复杂度尽可能的低。
比如: 1000010111000001,加粗的部分有4个0、4个1
思路:
(1) 最简单的想法就是遍历所有的子串,之后判断该子串是否满足条件
N^2子串,每个子串扫一遍判断0、1是否出现的次数相等,复杂度为O(N^3)
稍加思考就会发现, 如果一个长度为n的子串满足条件,加么这n个元素的和 加起来一定=(n/2)
这样在循环的过程中,增量加就可以了,不需要每个子串从头计算,复杂度降为O(N^2);
伪码:
输入 A[N]
int maxlen = 0, sum = 0, currlen = 0;
for(int i = 0; i < N; ++i)
{
sum = 0;
for(int j = i; j < N; ++j)
{
currlen = j - i + 1;
sum += int(A[j]);
if(currlen%2 == 0 && sum == currlen/2 && currlen > maxlen)
maxlen = currlen;
}
(2) 还有没有办法进一步降低算法的复杂度呢?
问了一下姚神,得到了这样一种巧妙的解法:定义一个数据B[N], B[i]表示从A[0...i]中 num_of_0 - num_of_1,0的个数与1的个数的差
那么如果A[i] ~ A[j]是符合条件的子串,一定有 B[i] == B[j],因为中间的部分0、1个数相等,相减等于0。 只需要扫一遍A[N]就能把B[N]构造出来了。
这样问题就转换成了求 距离最远的一对数,使得B[i] == B[j],因为B[i]的范围一定是[-N,N],-N到N的范围都存起来,这样每扫到B[i],查数就行了。
其实代码真的非常简单,一个循环就搞定了,这就是算法和思考的乐趣:)
int A[N],B[N];
int num[2*N + 1];
int count[2] = {0,0}, maxlen = 0, currlen = 0;
memset(C, 2*N, -1);
for(int i = 0; i < N; ++i)
{
count[ int(A[i]) ] += 1;
B[i] = count[1] - count[0];
if( num[ B[i] + N ] == -1)//尚不存在,B的下标是差,值是A的下标
num[ B[i] + N ] = i;
else//already exist
{
currlen = i - num[ B[i] + N ] + 1; //num[ B[i] + N ]是B[i]已存在的下标
if(currlen > maxlen)
maxlen = currlen;
}
即:用B数组的值当num数组的下标
转载请注明原文地址:http://www.cnblogs.com/worldisimple/archive/2012/04/13/2445051.html