大意是给两个序列,求第二个序列在第一个序列中的最小位置,无解输出-1。
朴素算法O(m*n),m<=10000,n<=1000000.肯定超时
所以就要用到KMP算法,俗称看毛片算法(我是不喜欢这么叫的。。)
KMP算法是预处理出目标串的失配边,然后遇到不匹配的就顺着失配边走,直到找到匹配。
看起来很难理解,那末举个例子:
1<=i<=11
b[i]=(1 2 3 1 2 5 6 1 2 3 4)
那末它的失配数组是
1<=i<=12
f[i]=(1 1 1 1 2 3 1 1 2 3 4 1)
意思是,当i这个位置不匹配时,就转到f[i]继续进行比较。
为什么多一个呢?因为匹配完之后要回到开头。
构造和比较很像,也是顺着失配边走
代码:
<span style="font-size:18px;">#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int f[1000020],b[1000020],a[1000010];
int j,n,m,t;
void kmp(int m)
{
f[1]=1;f[2]=1;
int j=0;
int i=0;
for(i=2;i<=m;++i)
{
j=f[i];
while(j>1&&b[i]!=b[j])j=f[j];//跟着失配边走,直到回到开头或找到匹配
if(b[i]==b[j])f[i+1]=j+1;
else f[i+1]=1;//如果相等就从下一个开始比较
}//构造失配边
j=1;
for(i=1;i<=n;++i)
{
while(j>1&&b[j]!=a[i])j=f[j];//跟着失配边走,直到回到开头或找到匹配
if(b[j]==a[i])++j;//如果相等就从下一个开始比较
if(j==m+1)
{
printf("%d\n",i-m+1);
return;
}
}
printf("%d\n",-1);
return;
}
int main()
{
//freopen("1711.in","r",stdin);
scanf("%d",&t);
for(int i=1;i<=t;++i)
{
memset(f,0,sizeof(f));
memset(a,0,sizeof(a));
memset(b,0,sizeof(b));
scanf("%d%d",&n,&m);
for(int j=1;j<=n;++j)
scanf("%d",&a[j]);
for(int j=1;j<=m;++j)
scanf("%d",&b[j]);
//if (kmp(m)==-1) printf("%d",-1);
kmp(m);
}
return 0;
}</span>