例如:输入cab,输出2。因为我们可以把它变为bb或者变为cc。 输入bcab,输出1。尽管我们可以把它变为aab -> ac -> b,也可以把它变为bbb,但因为前者长度更短,所以输出1。
函数头部: C/C++ int minLength(const char *s); Java: public class Main { public static int minLength(String s); }
这道题目难度有三颗星吧,我的程序虽然通过了,但是我也不知道为什么要这么写,只能说是直觉。。。
解题方法:
1、统计三个字母a,b,c的个数,分别为Acount, Bcount , Ccount;统计字符串的长度strlen;
2、通过一系列的数学证明,可知输出结果仅为三种,即1、2或strlen:
若字符串中的字符均为a或b或c,那么输出strlen;
若Acount, Bcount , Ccount均为奇数,那么输出结果result = 2;
若Acount, Bcount , Ccount均为偶数,那么输出结果result = 2;
若Acount, Bcount , Ccount有且仅有一个为偶数,那么输出结果result = 1;
若Acount, Bcount , Ccount有且仅有一个为奇数,那么输出结果result = 1;
证明方法:http://www.cnblogs.com/grenet/p/3300591.html
先给出几个概念
纯字符串:只含有一种字母的字符串称为纯字符串,例如AAA就是一个纯字符串
混字符串:含有至少两种字母的字符串称为混字符串,例如ABC就是一个混字符串
最优长度:字符串通过消除的最终结果的最短长度,称为该字符串的最优长度。上面的示例中,CAB的最优长度为2,BCAB的最优长度为1
最优串:字符串通过消除达到最优长度时的字符串称为最优串,最优串可能不止一个。如CAB的最优串为BB和CC,而BCAB的最优串为B。最优串一定是纯字符串
统计向量:用(X,Y,Z)表示字符串的统计向量,其中X、Y、Z分别表示字符串中字母A、B、C的个数。上面的示例中,CAB的统计向量为(1,1,1),BCAB的统计向量为(1,2,1)
统计特征向量:用(X,Y,Z)表示字符串的统计特征向量,其中X、Y、Z分别表示字符串中字母A、B、C的个数的奇偶性,用“奇”、“偶”表示。CAB的统计特征向量为(奇,奇,奇),BCAB的统计特征向量为(奇,偶,奇)
再给出几个推论
推论1:纯字符串的最优长度就是纯字符串的长度。
很明显的,只有一个字母,没法消除,所以最优长度就是纯字符串的长度
推论2:在纯字符串前或后加另一个字母得到新的混字符串,则新混字符串的最优长度为1
例如:BBBBBBBA。则消除的过程是,BBBBBBBA >> BBBBBBC >> BBBBBA >> BBBBC >> BBBA >> BBC >> BA >> C
其他的类似,不再赘述
推论3:若纯字符串的长度为偶数,则在前或后添加另一个字母得到新的混字符串,则新混字符串的最优串为添加的字母;若纯字符串的长度为奇数,则新混字符串的最优串为剩下的一个字母
假设纯字符串为BB,添加字母A,则新混字符串为BBA,BBA >> BC >> A
假设纯字符串为BBBB,添加字母A,则新混字符串为BBBBA,BBBBA >> BBA >> A
以此类推,推论3的前半部得证
假设纯字符串为B,添加字母A,则新混字符串为BA,BA >> C
假设纯字符串为BBB,添加字母A,则新混字符串为BBBA,BBBA >> BA >> C
以此类推,推论3的后半部得证
推论4:混字符串的最优长度不超过2(为1或2)
证明:
首先混字符串通过不停的消除,最终能得到一个纯字符串(因为若还有不同的字母,则必相邻,则还能继续消除)。
若该纯字符串的长度为1或2,则证明了该推论(不过,就算纯字符串长度为2,还没证明最优长度一定是2,可以肯定的是最优长度不超过2,即1或2都有可能)
若该纯字符串的长度大于2,不失一般性,假设该纯字符串的长度为K(K>2),该纯字符串都由字母B组成(字母A、C是一样的),该纯字符串是通过N(N≥1)步消除得到的
那么回退一步,第N-1步消除得到的混字符串为B……BACB……B,其中A前面有K1个B,C后面有K2个B,K1+K2=K-1。(也有可能是B……BCAB……B,和B……BACB……B是一致的,不再赘述了)
那么,根据K1和K2的取值不同,可以优化出不同的消除
K1是奇数,K2是奇数。利用推论3,可知B……BA >> C;CB……B >> A;B……BACB……B >> CA >> B,最优串是B,最优长度为1
K1是奇数,K2是偶数。利用推论3,可知B……BA >> C;CB……B >> C;B……BACB……B >> CC,则最优长度不超过2(因为还没法证明最优长度不会是1)
K1是偶数,K2是奇数。利用推论3,可知B……BA >> A;CB……B >> A;B……BACB……B >> AA,则最优长度不超过2(因为还没法证明最优长度不会是1)
K1是偶数,K2是偶数。利用推论3,可知B……BA >> A;CB……B >> C;B……BACB……B >> AC >> B,最优串是B,最优长度为1
综上所述,混字符串的最优长度不超过2
推论5:统计特征向量为(奇,奇,奇)或(偶,偶,偶)的混字符串的最优长度为2;其余的混字符串的最优长度为1
证明:
考察一下,每次消除,统计特征向量的变化过程
假设字符串的统计特征向量为(奇,奇,奇)
假设消除是AC(或CA) >> B,则A和C的个数减1,而B的个数增加1,则统计特征向量变为(偶,偶,偶)
假设消除是AB(或BA) >> C,则A和B的个数减1,而C的个数增加1,则统计特征向量变为(偶,偶,偶)
假设消除是BC(或CB) >> A,则B和C的个数减1,而A的个数增加1,则统计特征向量变为(偶,偶,偶)
综上所述,统计特征向量为(奇,奇,奇)的混字符串,经过1次消除后,统计特征向量变为(偶,偶,偶)
同理可证,统计特征向量为(偶,偶,偶)的混字符串,经过1次消除后,统计特征向量变为(奇,奇,奇)
由此可知,反复消除后,统计特征向量为(奇,奇,奇)的混字符串的最优串的统计特征向量是(偶,偶,偶)。(因为最优串是纯字符串,只能有1种字符,所以最优串不可能是(奇,奇,奇))
同理可证,统计特征向量为(偶,偶,偶)的混字符串的最优串的统计特征向量也是(偶,偶,偶)。
因此,统计特征向量为(奇,奇,奇)或(偶,偶,偶)的混字符串的最优串的统计特征向量为(偶,偶,偶)
假设字符串的统计特征向量为(奇,偶,偶)
假设消除是AC(或CA) >> B,则A和C的个数减1,而B的个数增加1,则统计特征向量变为(偶,奇,奇)
假设消除是AB(或BA) >> C,则A和B的个数减1,而C的个数增加1,则统计特征向量变为(偶,奇,奇)
假设消除是BC(或CB) >> A,则B和C的个数减1,而A的个数增加1,则统计特征向量变为(偶,奇,奇)
综上所述,统计特征向量为(奇,偶,偶)的混字符串,经过1次消除后,统计特征向量变为(偶,奇,奇)
同理可证,统计特征向量为(偶,奇,奇)的混字符串,经过1次消除后,统计特征向量变为(奇,偶,偶)
由此可知,反复消除后,统计特征向量为(奇,偶,偶)的混字符串的最优串的统计特征向量是(奇,偶,偶)。(因为最优串是纯字符串,只能有1种字符,所以最优串不可能是(偶,奇,奇))
同理可证,统计特征向量为(偶,奇,奇)的混字符串的最优串的统计特征向量也是(奇,偶,偶)。
因此,统计特征向量为(奇,偶,偶)或(偶,奇,奇)的混字符串的最优串的统计特征向量为(奇,偶,偶)
同理可证
统计特征向量为(偶,奇,偶)或(奇,偶,奇)的混字符串的最优串的统计特征向量为(偶,奇,偶)
统计特征向量为(偶,偶,奇)或(奇,奇,偶)的混字符串的最优串的统计特征向量为(偶,偶,奇)
由推论4可知,混字符串的最优长度不超过2
如果,混字符串的最优长度为1,则最优串是A,统计特征向量是(奇,偶,偶);是B,统计特征向量是(偶,奇,偶);是C,统计特征向量是(偶,偶,奇)
如果,混字符串的最优长度为2,则最优串是AA或BB或CC,统计特征向量是(偶,偶,偶)
所以,统计特征向量为(奇,奇,奇)或(偶,偶,偶)的混字符串的最优长度是2。
统计特征向量为(奇,偶,偶)或(偶,奇,奇)的混字符串的最优长度为1,最优串是A
统计特征向量为(偶,奇,偶)或(奇,偶,奇)的混字符串的最优长度为1,最优串是B
统计特征向量为(偶,偶,奇)或(奇,奇,偶)的混字符串的最优长度为1,最优串是C
证明完毕
结论:
1、纯字符串的最优串就是自身,最优长度就是自身的长度
2、统计特征向量为(奇,奇,奇)或(偶,偶,偶)的混字符串的最优长度为2
3、其余的混字符串的最优长度是1,其中统计特征向量为(奇,偶,偶)或(偶,奇,奇)的混字符串的最优串是A;统计特征向量为(偶,奇,偶)或(奇,偶,奇)的混字符串的最优串是B;统计特征向量为(偶,偶,奇)或(奇,奇,偶)的混字符串的最优串是C
代码实现(利用规律): http://www.cnblogs.com/bestdavid/p/stringeliminate.html#include <stdio.h>
#include <stdlib.h>
int ISeven(int n)
{
if(n % 2 == 0) return 1;
else return 0;
}
int minLength(const char *s)
{
int Acount = 0, Bcount = 0, Ccount = 0, iterCount = 0 , Strlen = 0;
for(iterCount = 0; s[iterCount] != '\000'; iterCount++)
{
switch(s[iterCount])
{
case 'a': Acount++; break;
case 'b': Bcount++; break;
case 'c': Ccount++; break;
}
Strlen++;
}
if(Acount == Strlen || Bcount == Strlen || Ccount == Strlen )
{
return Strlen;
}
printf("a:%d b:%d c:%d len = %d\n",Acount,Bcount,Ccount,Strlen);
switch(ISeven(Acount) + ISeven(Bcount) +ISeven(Ccount))
{
case 0: return 2;
case 1: return 1;
case 2: return 1;
case 3: return 2;
default: return 0;
}
}
int main(void)
{
int result = 0;
result = minLength("cccabcc");
printf("the minlen is %d\n",result);
return 0;
}
不使用数学规律:http://www.cnblogs.com/pmer/p/3293038.html
#include <stdio.h>
#include <string.h>
#define MAX 200
typedef char String[ MAX + 1 ];
#define N(x) N_(x)
#define N_(x) #x
void input( char * );
unsigned min_len( char * );
void reduce( char * , char * , unsigned );
char turn ( char , char );
int main( void )
{
String str;
input( str );
printf("替换最终结果的最短长度为%u。\n" , min_len( str ) );
return 0;
}
char turn ( char c1 , char c2 )
{
return 'a' + 'b' + 'c' - c1 - c2 ;
}
void reduce( char * st , char * ss , unsigned i )
{
strncpy( st , ss , i );
st[i] = turn ( ss[i] , ss[i+1] );
strcpy( st + i + 1 , ss + i + 2 );
}
unsigned min_len( char *s )
{
int len = strlen( s );
int i = 0 ;
while ( s[i] != '\0' && s[i+1] != '\0' )
{
if ( s[i] != s[i+1] )
{
String newstr ;
unsigned newlen ;
reduce( newstr , s , i );
newlen = min_len( newstr );
if ( newlen < len )
len = newlen ;
}
i ++ ;
}
return len;
}
void input( char *s )
{
puts("输入字符串");
scanf("%"N(MAX)"[abc]s",s);
puts("要确定长度的字符串为:");
puts( s );
}