1.KMP
A 方法一:
-
概念:1) s[ ] 模式串(长)
2) p[ ] 模板串(短) 3) ne[ ]即next[ ]代表p[ ]中前k个字符恰等于后k个字符,且k取最大值
-
核心思想:利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。即不是一个一个匹配,而是直接跳到与p[ ]前缀相同的后缀位置。 如图:
-
-
s[i=6]!=p[j+1=6],∵next[j=5]=2,∴可直接把p串从后缀=前缀的地方开始
#include<stdio.h> char s[1000009],p[100009]; int ne[100009]; int main() { int n,m,i,j; scanf("%d",&n); getchar(); gets(p+1);//下标1开始 scanf("%d",&m); getchar(); gets(s+1); //构造ne[] //下标从1开始,ne[0]=0,ne[1]=0,表示若第一个不匹配,则从重新开始配 for(i=2,j=0;i<=n;i++) //p,s,ne下标都从1开始 { //i找后缀,j找前缀 //如果j还能向前&&p[j+1]与p[i]不匹配时,j往前找后缀对应的前缀位置 //即j相当于当前后缀位置,ne[j]为与j匹配的后缀位置 //即p[j]==p[ne[j]] //若ne[j]==0,则没有对应相等的前缀 while(j&&p[j+1]!=p[i])j=ne[j]; if(p[i]==p[j+1])j++; //若相等,则继续往下找 ne[i]=j;//每个元素i都对应一个相等前缀的下标j,使p[ne[i]]==p[j]||ne[i]==0 } //s[]p[]匹配 for(i=1,j=0;i<=m;i++) { //i遍历s[],j遍历p[] while(j&&s[i]!=p[j+1])j=ne[j]; //不匹配时,p[]往s[]的后移 if(s[i]==p[j+1])j++;//匹配成功,继续匹配 if(j==n)//全部匹配成功 { printf("%d ",i-n); j=ne[j];//继续匹配 } } return 0; }
B 方法二
Subject:从pos开始的第一个匹配的初始位置。
#include<stdio.h> #include<string.h> #define N 10009 #define M 100009 char s[M],p[N]; int ne[N];//j应退回的p[]串中的下标,p[j]==p[next[j]] int ls,lp; //ne[] void get_ne() { int i=1,j=0;//p[]下标从1开始//j找前缀,i遍历p[] ne[1]=0; //∵p[1]前已经没有元素可以退了,∴让j=0重新开始 while(i<lp)//i遍历p[] { if(j==0||p[i]==p[j]) //若j=0则p[]退无可退,只能+1,从头开始找; { //p[i]也没有匹配的,∴+1找下一个,和p[1]比较 i++; //相等时继续+1找下一个 j++; if(p[i]!=p[j]) { ne[i]=j;//需要重新开始的位置 } else { ne[i]=ne[j];//相同前缀的下标 } } else { j=ne[j];//不相符,则j回溯 } } } //匹配 void KMP(int pos)//输出从pop开始匹配的初位置 { int i=pos,j=1, get_ne(); while(i<=ls&&j<=lp) { if(j==0||s[i]==p[j])//相等,则继续匹配 { i++; j++; } else { j=ne[j];//指针退后到合适位置 } } if(j>lp) { printf("%d ",i-lp); } else { printf("0"); } } int main() { int n,m; scanf("%d",&n); getchar(); gets(p+1);//下标1开始 scanf("%d",&m); getchar(); gets(s+1); ls=strlen(s+1); lp=strlen(p+1); KMP(1); return 0; }