KMP算法的原理具体请看以下博客:
从头到尾彻底理解KMP(2014年8月22日版)(其中有关于BM算法和Sunday算法的介绍)
KMP算法最浅显理解——一看就明白
转自知乎-我见过最通俗易懂的KMP算法详解
kmp算法介绍
KMP模版 && KMP求子串在主串出现的次数模版
next数组的求法:先将next数组初始化为0,将子串和自己进行匹配,第一个不进行匹配(next[0]=-1),从第二个开始进行匹配,即从下标为1进行匹配,将其与自己从头到尾进行匹配,(即zi[1]和zi[0]匹配),若不一样则next[1+1]=0 (然后下一个zi[2]重新和zi[0]匹配),若一样则next[1+1]=1(然后下一个zi[2]和zi[1]匹配,一样就next[2+1]=2(下一个也一样就next[3+1]=3),不一样就next[2+1]=0(然后zi[2]回去和zi[0]匹配),按此规律循环下去。
next 数组各值的含义:代表当前字符之前的字符串中,有多大长度的相同前缀后缀。例如如果next [j] = k,代表j 之前的字符串中有最大长度为k 的相同前缀后缀。
在某个字符失配时,该字符对应的next 值会告诉你下一步匹配中,模式串应该跳到哪个位置(跳到next [j] 的位置)。如果next [j] 等于0或-1,则跳到模式串的开头字符,若next [j] = k 且 k > 0,代表下次匹配跳到j 之前的某个字符,而不是跳到开头,且具体跳过了k 个字符。
字符串匹配题目:对每个测试用例,输出一行结果:是否子串,是则输出"yes" ,否则输出 “no”
#include<stdio.h>
#include<string.h>
#define max 10005
char zhu[max],zi[max];///zhu为主串,zi为子串
int next[max+2];
void Get_Next(int S)///先求出next数组,S为zi的字符串长度
{
/*int i = 0, j = -1;
next[i] = j;
while(i < S){
while( j != -1 && zi[i] != zi[j]) j = next[j];///回溯,使j回到-1
next[++i] = ++j;
}*/
//网上求next数组的模板为上面注释掉的内容,下面是自己写的求next数组
int i=1,k=0,next[0]=-1;
while(i<S)
{
if(zi[i]!=zi[k])
i++,k=0;
else
i++,k++;
next[i]=k;
}
}
int Kmp()
{
int S=strlen(zi),L=strlen(zhu),i=0,j=0;
Get_Next(S);
while(i<L)
{
/*while(j!=-1&&zhu[i]!=zi[j]) ///注意这里要while循环
j=next[j];
i++,j++;*/
//或者也可以用上面所注释的这种写法
if(j==-1||zhu[i]==zi[j])
i++,j++;
else
j=next[j];
if(j==S)
return 1;
}
return 0;
}
int main()
{
int T;
scanf("%d",&T);
while(T--)
{
scanf("%s%s",zhu,zi);
int q=Kmp();
if(q)
printf("yes\n");
else
printf("no\n");
}
return 0;
}
KMP求子串在主串出现的次数模板:
求取出现的次数 :
#include<bits/stdc++.h>
const int maxn = 1e6 + 10;
char mo[maxn], str[maxn];///mo为模式串、str为主串
int next[maxn];
inline void GetNext()
{
int i = 0, j = -1, len = strlen(mo);
next[i] = j;
while(i < len){
// if(j == -1 || mo[i] == mo[j]) next[++i] = ++j;
// else j = next[j];
while( j != -1 && mo[i] != mo[j]) j = next[j];
next[++i] = ++j;
}
}
int KmpCount()///计算模式串在子串出现的次数
{
GetNext();
int i = 0, j = 0, strL = strlen(str), moL = strlen(mo);
int ans = 0;
while(i < strL){
while( j != -1 && mo[j] != str[i]) j = next[j];
i++, j++;
if(j == moL) ans++;
}
return ans;///返回模式串在主串中出现的次数(可重叠出现)
}
int main(void)
{
scanf("%s %s", str, mo);
printf("%d\n", KmpCount());
return 0;
}
求模式串第一次在主串出现的位置 or 匹配是否在主串出现过 :
#include<bits/stdc++.h>
const int maxn = 1e6 + 10;
char mo[maxn], str[maxn];///mo为模式串、str为主串
int next[maxn];
inline void GetNext()
{
int i = 0, j = -1, len = strlen(mo);
next[i] = j;
while(i < len){
while( j != -1 && mo[i] != mo[j]) j = next[j];
next[++i] = ++j;
}
}
int KmpIndex()
{
GetNext();
int i =0, j = 0, strL = strlen(str), moL = strlen(mo);
while(i < strL && j < moL){//对比上面计算模式串在子串出现的次数的代码,为什么这里要加个&& j < moL
while( j != -1 && str[i] != mo[j]) j = next[j];
i++, j++;
}
if(j == moL) return i - moL;///返回模式串在主串中首次出现的位置,即完全匹配时的开始下标,下标从0开始
else return -1;///不存在匹配情况
}
int main(void)
{
scanf("%s %s", str, mo);
printf("%d\n", KmpIndex());
return 0;
}