求字符串b 是否是字符串a 的子串
对于字符串设两个指针 i 和 j a[i-j+1……i] 与字符串 b[1……j]是完全相等的例如
1 2 3 4 5 6 7 8 9 10 11
a: a b a b a b a a b a b
b: a b a b a c b
1 2 3 4 5 6 7
令i =11 则 j =4 a串中从i-j 到 i 与b串中1-j中的字母完全相等 均为abab由此可知 i 一定是递增的,
如果a[i+!]==b[j+1] 则 j++
如果a[i+!]!=b[j+1],由于i 是递增,无需管,只需考虑j 这时需要重新调整j 的值,使a[i-j+1……i] 与字符串 b[1……j]是完全相等
例如 现在i =5 j=5,a[i+1]!=b[j+1],那么重新调整j 的值,这事j的值如何确定呢?
看 此时 a[i+1]='b' ,将j 向前找,当j=4的时候 b[j]=b [j+1]='a'显然 这是b[j+1]!=a[i+1];
当j=3时 b[j]='a' b[j+1]='b'=a[i+1] 成立,而且 当j=3,i=5时,满足 a[i-j+1……i] 与字符串 b[1……j]完全相等的条件
则此时i =5 j=3 满足条件,
1 2 3 4 5 6 7 8 9 10 11
a: a b a b a b a a b a b
b: a b a b a c b
1 2 3 4 5 6 7
接着循环 i=6 时 条件满足 a[6+1]==b[3+1] j++;
i=7 时
1 2 3 4 5 6 7 8 9 10 11
a: a b a b a b a a b a b
b: a b a b a c b
1 2 3 4 5 6 7
此时 a[i+1]!=b[j+1]
又要重新确立 j 的值,按照上面的方法,继续寻找j 的值,发现,这时,j 的值只能是0,如此循环知道找到能够匹配到最后的字符串的位置
但是有时候会出现,即使j 变成0 也没办法匹配的情况
例如
a: abcadef
b: adef
当i=2 j即使等于0 也无法匹配
现在大部分看毛片算法基本上都理解了,可惜对j的确认还是有点不理解,怎么样确认j 的值,可以事先将j的确立放到一个数组p[] 中,但是这个我还没理解透,以后再说吧
for(i=2;i<=m;i++)
{
while(j>0&&b[j+1]!=b[i])
j=p[j];
if(b[j+1]==b[i])
j++;
p[i]=j;
}
这是在别人那里抄来的p数组的确认方法,我还不理解why
#include <iostream>
#include <cstdio>#include <cstring>
using namespace std;
char a[100],b[100];
int p[100];
int n,m;
int solve()
{
memset(p,0,sizeof(0));
int i,j;
j=0;
for(i=2;i<=m;i++)//p 初始化
{while(j>0&&b[j+1]!=b[i])
j=p[j];
if(b[j+1]==b[i])
j++;
p[i]=j;
}
j=0;
for(i=1;i<=n;i++)//字符串的匹配
{
while(j>0&&b[j+1]!=a[i])
j=p[j];
if(b[j+1]==a[i])
j++;
if(j==m)
return i-m+1;
}
return -1;
}
int main()
{
int i;
while(scanf("%d%d",&n,&m)!=EOF)
{
getchar();
for(i=1;i<=n;i++)
scanf("%c",&a[i]);
getchar();
for(i=1;i<=m;i++)
scanf("%c",&b[i]);
printf("%d\n",solve());
}
return 0;
}