时间复杂度
假设一个for循环
for(i=0;i<n;i++)
{}这个for循环的时间复杂度就为O(n)
for(i=0;i<n;i++)
{
for(j=0;j<m;j++)
{
}
}这个for循环的时间复杂度就为O(mn)
在解决字符串匹配问题时,如果按照普通的算法
即:
例如:abaabaabcacaabc
要判断abbaabc是否位于这个字符串中
1:abaabaabcacaabc
ab/aabc(/处错误)
2:abaabaabcacaabc
a(错误,则再次向后移动)
这样一次一次向后移,假设两个字符串的长度分别为m和n;
则时间复杂度很大,为O(mn)
这时就要用到KMP函数
思想:abaabaabcacaabc(主串)
abbaabc(模板串)
在第一次匹配失败后,
abaabaabcacaabc
abbaabc
直接从与前缀相同的后缀的下一个开始
这样就可以节省大量时间
KMP算法的想法是,设法利用这个已知信息,不要把"搜索位置"移回已经比较过的位置,继续把它向后移,这样就提高了效率。
next数组就是求匹配失败后从哪里开始的!
1 void next(char s,int len)
2 {
3 int i=0;
4 int j=-1;
5 next[0]=-1;
6 while(i<len)
7 {
8 if(j==-1||s[i]==s[j])
9 {
10 i++;
11 j++;
12 next[i]=j;
13 }
14 else
15 {
16 j=next[j];
}
}
}
1:next函数是对模板串进行操作,函数前提数据应该是模板串以及它的长度!
3,4:引入j=-1;i=0;是为了事next【0】的值定义为-1还有使abaabaabcacaabc
abbaabc
比较向后进行下去,如
初始时i=0;j=-1;
则满足j==-1这一条件则i++。j++;j=0;
next【1】=0
这样就给next【1】赋了值,后来i=1;
j=0;然后就开始对模板串的第一个还有第二个字符进行判断是否相等!如果相等的话i=2;j=1;next【2】=1;
否则j=next【j】=next【0】=-1;
这个否则实际上是对是s【j】前的字符串进行next操作!
。。。。。。。。。。。。。。。。。。。。
在解决完next函数后就要来创建KMP函数!KMP函数实际上就是一个判断函数!
这个函数中引入两个变量i和j
代表字符判断前进到的位置;
函数中的while循环结束后如果j的值大于或等于模板串的长度,就代表主串中存在着模板串!也就是判断正确,否则为错误!
void panduan(int l,int s)
{
int i=0,j=0;
while(i<s&&j<l)//这个是字符串的长度限制!
{
if(j==-1||s2[j]==s1[i])
{
i++;
j++;
}
else
{
j=next[j];
}
}
if(j>=l)
{
printf("%d\n",i-j+1);//正确就输出模板串在主串中的位置!
}
else
{
printf("-1\n");
}
}
最后就是主函数
int main()
{
int l,s;
while(scanf("%s",s1)!=EOF)
{
scanf("%s",s2);
l=strlen(s2);
s=strlen(s1);
findnext(l);
panduan(l,s);
}
return 0;
}
这个就是我在听完学长讲解后对KMP的理解!