【作用】maybe
在一个已知字符串中查找子串的位置,用于字符串查找与匹配
【暴力匹配算法】
1.指针i,j 分别从0开始遍历字符串s和子串p,然后比较s[i]和p[j]
2.如果s[i]==p[j],说明匹配成功,i++,j++,匹配下一位
3.如果s[i] ! =p[j],说明失配,则令i=i-j+1,j=0,重新开始匹配
4.此时时间复杂度为 log (m*n)
【分析】
所以KMP就是对以上的优化……
1.一些概念
前缀和后缀
对于一个字符串 "abcabb"
前缀 : "a","ab","abc","abca","abcab","abcabb"
后缀 : "b","bb","abb","cabb","bcabb","abcabb"
真前缀(真后缀)就是不包括第一个(最后一个)字符的前缀(后缀),类似于子集和真子集啦
next数组
next数组存储的是每一个下标对应的“部分匹配值”,是KMP算法的核心。
怎么说呢,有点复杂。
对next[ j ] ,是p[ 1, j ]串中前缀和后缀相同的最大长度(部分匹配值),即 p[ 1, next[ j ] ] = p[ j - next[ j ] + 1, j ]。
2.每次找next数组或者匹配,j都从0开始,这样就让s[i]与p[j+1]比较。找next数组时,i要从2
开始,因为第一个数的next数组显然不存在;匹配时,i从1开始,会比从0开始简单很多,,
3.s[ a , b ] = p[ 1, j ] && s[ i ] != p[ j + 1 ] 此时要移动p串(不是移动1格,而是直接移动到下次能匹配的位置)
其中1串为[ 1, next[ j ] ],3串为[ j - next[ j ] + 1 , j ]。由匹配可知 1串等于3串,3串等于2串。所以直接移动p串使1到3的位置即可。这个操作可由j = next[ j ]直接完成。 如此往复下去,当 j == m时匹配成功。
4.KMP算法的时间复杂度时O(n)
【代码】
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+10;
int ne[N];
char s[N],p[N];
int n,m;
int main(){
cin>>n>>p+1;
cin>>m>>s+1;
for(int i=2,j=0;i<=n;i++){
while(j && p[i]!=p[j+1]) j=ne[j];
if(p[i]==p[j+1]) j++;
ne[i]=j;
}
for(int i=1,j=0;i<=m;i++){
while(j && s[i]!=p[j+1]) j=ne[j];
if(s[i]==p[j+1]) j++;
if(j==n) {
cout<<i-n<<" ";
//j=ne[j];
}
}
return 0;
}