BF算法
#include <iostream>
#include <bits/stdc++.h>
using namespace std;
int Index_BF(char *a,char *b,int pos)
{//返回b在主串a中第pos个字符开始第一次出现的位置。
int i,k,j;
for(i=pos;i<strlen(a);i++)
{ int flag=0;
for(k=i,j=0;k<strlen(b),j<strlen(b);k++,j++)
if(b[j]!=a[k]){flag=1;break;}
if(flag==0)return i+1;//返回该字符的位置而不是字符下标
}
return 0;
}
int main()
{
char S[100],T[100];
cin>>S>>T;
int pos;
cin>>pos;
int ans=Index_BF(S,T,pos);
if(ans!=0)cout<<ans<<endl;
else cout<<"匹配失败"<<endl;
return 0;
}
KMP算法
#include <iostream>
#include <bits/stdc++.h>
using namespace std;
//acabaabaabcacaabc abaabc
void get_next(int *next,char *a)
{
int i=0,k=-1;
next[0]=-1;
while(i<strlen(a)-1)
{
if(k==-1||a[i]==a[k]){i++;k++;next[i]=k;}
else k=next[k];
}
}
int Index_KMP(char *a,char *b,int *next,int pos)
{
int i=pos-1;//第pos个字符下标为pos-1;
int j=0;
while(i<strlen(a) && j<(int)strlen(b))//strlen函数的返回值是一个无符号整型数据,在比较大小时可能会出错,所以使用强制转换
{
if(-1==j||(a[i]==b[j])){i++;j++;}
else j=next[j];
}
if(j==(int)strlen(b)){return i-strlen(b)+1;}//返回首字符是主串中第几个字符,而不是返回首字符下标
return 0;
}
int main()
{
char S[100],T[100];
cin>>S>>T;
int pos,next[100];
cin>>pos;
get_next(next,T);
int ans=Index_KMP(S,T,next,pos);
if(ans!=0)cout<<ans<<endl;
else cout<<"匹配失败"<<endl;
return 0;
}
计算next函数修正
模式"aaaab" 在和主串"aaabaaaab"匹配时,当 i = 4 、 j= 4 时s.ch [4] 不等于t.ch [4] , 由next[j]的指示还需进行 i = 4 、j = 3, i = 4 、 j = 2, i = 4 、j=1这 3 次比较。实际上,因为模式中第 1~3个字符和第 4 个字符都相等,因此不需要再和主串中第 4 个字符相比较,而可以将模式连续向右滑动 4个字符的位置直接进行 i = 5 、j = 1 时的字符比较。这就是说,若按上述定义得到 next[j] = k , 而模式中 t[j]=t[k], 则 当主串中字符 s[i]和t[j]比较不等时,不需要再和t[k]进行比较,而直接和模式串t[next[k]]进行比较,换句话说此时的next[j] 应和 next[k]相同。
void get_nextval(int *nextval,char *a)
{
int i=0,k=-1;
nextval[0]=-1;
while(i<strlen(a)-1)
{
if(k==-1||a[i]==a[k])
{i++;k++;
if(a[i]!=a[k])
nextval[i]=k;
else nextval[i]=nextval[k];
}
else k=nextval[k];
}
}
对文章中KMP代码与书中表示略有不同,对此进行以下说明:
1.字符串的存储从下标0开始
2.next[0]=-1,next[1]=0