原问题来自:http://topic.csdn.net/u/20090826/18/C08B69E8-CE22-4427-8687-FFB53E380437.html
问题如下:
有一连串字母,由且必由若干个 A,B,C,D,E 组成,顺序是:
若干个 A,若干个 B,若干个 C,若干个 D,若干个 E
即:
A,A,...,A,B,B,...,B,C,C,...,C,D,D,...,D,E,E,...,E
现在已知的是所有字母一共是 1000 个,连续存储
如何找到第一个B,第一个C,第一个D,第一个E 出现的位置,
要求比较的次数最少
要解这个问题,最简单的是线性的查找,不过二分法也不错。
我写的源程序如下:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
void find(char *str,int *numstr);
int _tmain(int argc, _TCHAR* argv[])
{
int i;
char str[200];
int numstr[5];
char *p=str;
int part=10;
memset(str,'/0',sizeof(str));
for(i='A';i<='E';i++){
memset(p,i,part);
p+=part;
part+=10;
}
find(str,numstr);
for(i=0;i<5;i++)
printf("%c =%d/n",i+'A',numstr[i]);
return 0;
}
void find(char *str,int *numstr)
{
int begin,end,mid;
int first[6];
int i,number;
int relate;
first[5]=strlen(str)-1;
for(i=1;i<5;i++){
first[i]=first[5];
}
first[0]=0;
for(number=1;number<5;number++){
if(first[number]==first[number+1] )
first[number]=first[number-1]+1; //backward to forward
begin=first[number];
end=first[number+1];
while(1){
mid=(begin+end)/2;
if(str[mid]<number+'A'){
if(str[mid+1]==number+'A'){
first[number]=mid+1;
break;
}
begin=mid+1;
}
else if(str[mid]>=number+'A'){
if(str[mid-1]==number+'A'-1){
first[number]=mid;
break;
}
end=mid-1;
relate=str[mid]-'A'+1;
if(first[relate]>mid)
first[relate]=mid;
}
}
for(i=4;i>number;i--){
if(first[i+1]<first[i])
first[i]=first[i+1];
}
}
for(i=0;i<5;i++)
numstr[i]=first[i];
}
写程序最要紧的是抓住思路,有了思路怎么都写的出,没有则只会越写越混乱。
在这个程序中,最基本的思想是二分,begin,end,mid,三个变。
最简单的,begin=0,end=strlen(str),四次均如此查找,绝对正确。
再聪明点,begin每次用上一次的结束点+1。
都这样了,在用点力,采用数组记录信息,使每次的begin,end都尽量小些,不是更快。
这个信息太多不好,太少也不好。这里是用first[]来记录每一个的前位置,即
first[i]<=numstr[i]<first[i+1](这里多了一个first[5])
这样我们每次都有限定了。
但first[]总得有个初始的值,我们初始为strlen(str)-1.
所以first[number]之前用于限定numstr[number-1]的上限,这里没问题,因为first[number]初始为
strlen(str)-1,然后在轮到number时,变为numstr[number]的下限
但怎么区分有效的first[number]和无效的呢?
如果first[number]==first[number+1],表明first[number]的值是下一个更新得到的,而不是
一个可用于下限的值,应用first[number-1]+1代替
而且在一次numstr值确定后,更新一次first[]值
基本的思路就是这样
在实际测试时,遇到两个问题:
1. first[relate]值的更新
if(first[relate]>mid)
first[relate]=mid;
这里first[relate]的值总是趋于最小,这里或许first[relate]跟他的目标值相差较远,应该为
if(first[relate]>mid&&first[relate]==first[relate+1])
first[relate]=mid;
可实际上,在本程序的例子中,用前者的效率可能更好一些。因为在轮到relate的确定时,
下限偏小,上限偏大,一平均也接近目标值。对于不同例子,可能两者效率比较也不同,所以
可变可不变。
2. 在main中
使用了memset(str,'/0',sizeof(str));
由于str在这里定义 char str[200];所以sizeof(str)可以正确求值,换用200也是可以的。
而str是一个未定义的字符数组,所以不能用strlen(str)。