在学习字符串算法的时候,一定要学习的算法之一,就是KMP算法,俗称看毛片算法。KMP算法是一种字符串匹配算法,是一种高效的算法,我们正常的暴力匹配的方法的时间复杂度是n*m,但是KMP算法的时间复杂是n+m,相比之下KMP算法的优势就体现出来,这个算法的思路是,当模式串和匹配串不匹配时,匹配串不会返回到开始匹配的位置,模式串也不会清零,而是通过next数组中记录的值,来进行下一个字符的匹配,也就是说匹配串只会增加,不会减少,而模式串则是根据next数组的值来调节位置。所以next数组的作用就是,告诉模式串,当与匹配串不匹配时应该跳到哪里去匹配下一个字符串,所以,我们需要预先处理一下模式串,处理的结果就是一个next数组。
具体的代码实现就用一道题来解释。
POJ的3461
题意就是 求一个模式串,在匹配串中的出现次数
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N = 1e5 + 10;
int next[N];
void get_next(char *a){
int len = strlen(a);
next[0] = next[1] = 0;
//memset(next,0,sizeof(next));
for(int i = 1; i < len ; i ++){
int j = next[i];
while(j && a[i] != a[j]) j = next[j];
next[i+1] = (a[i] == a[j]) ? j+1 : 0;
}
}
int kmp(char *a,char *b){
int len_a = strlen(a);
int len_b = strlen(b);
get_next(b);
int j = 0;
int cnt = 0;
for(int i = 0 ; i < len_a ; i++){
while(j && a[i] != b[j])
j = next[j];
if(a[i] == b[j])
j++;
if(j == len_b)
cnt++;
}
return cnt ;
}
int main(){
int z;
scanf("%d",&z);
while(z--){
char a[N],b[N];
scanf("%s%s",a,b);
int ans = kmp(b,a);
printf("%d\n",ans);
}
return 0 ;
}