给定两个字符串A,B(B长度小于A),问B在A中出现的位置,此时可用KMP算法。KMP算法是一对一的。
KMP算法时间复杂度为n+m,n和m是两个字符串的长度。string的find一般比kmp慢(貌似是n*m的暴力算法)。
next数组: 算法中常用的next数组是记录从开始到失去匹配的i位置时构成的字串的可匹配字串,不太好理解。举个例子:
ababa,从0开始.
当i=3,若匹配的串为abac,但应该匹配abab,所以此时失去匹配。则next[3]=1,因为abac的最后一个位置的前一个(abac)为a,a也是ababa字符串的第一个,所以下一次循环时应从当前位置 -next[3](减去1)开始。
KMP算法不太好理解,但实现很简单。
例题:KMP
KMP算法时间复杂度为O(n+m),n和m是两个字符串的长度
#include<bits/stdc++.h>
#define MAXN 1000100
using namespace std;
char s1[MAXN],s2[MAXN];
int lenth1,lenth2;
int next_my[MAXN];
int getNext()
{
int k=0;next_my[0]=next_my[1]=0;
for(int i=1;i<lenth2;i++){
while(k>0 && s2[k]!=s2[i])
k=next_my[k];
next_my[i+1]= (s2[k]==s2[i]) ? ++k : 0;
}
}
int kmp()
{
getNext();
int j=0;
for(int i=0;i<lenth1;i++){
while(j>0 && s2[j]!=s1[i])
j=next_my[j];
if(s2[j]==s1[i])
j++;
if(j==lenth2){//匹配成功,输出找到的字串的位置,0开始
printf("%d\n",i-lenth2+1);
}
}
}
int main()
{
scanf("%s%s",s1,s2);
lenth1=strlen(s1);lenth2=strlen(s2);
kmp();
// for(int i=1;i<=lenth2;i++){
// printf("%d ",next_my[i]);
// }
return 0;
}