一、题目
给定一个模式串 S,以及一个模板串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串 PP 在模式串 S 中多次作为子串出现。
求出模板串 P 在模式串 S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N,表示字符串 P 的长度。
第二行输入字符串 PP。
第三行输入整数 M,表示字符串 S 的长度。
第四行输入字符串 S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤N≤1e5
1≤M≤1e6
输入样例:
3
aba
5
ababa
输出样例:
0 2
二、题目解析
给定一个母字符串s[N](较长的串),和一个模板字符串p[N](较短的串),在母串s中找到含有模板串p,并且将s串中出现p串的首个元素的下表输出;
如题:
三、解题方法
1、朴素暴力做法
#include<iostram>
using namespace std;
const int N = 100010;
char s[N],p[N];
int main()
{
int n,m;
cin >> n >> p + 1 >> m >> s + 1;
for(int i = 1;i <= m;i ++)
{
if(s[i] == p[1])
for(int j = 1;j <= n;j ++)
{
if(p[j]!=s[i + j])
break;
if(j == n)cout << i - 1<< " ";
}
}
return 0;
}
这样的时间的复杂度是O(n^2),KMP算法就是对暴力进行优化;
2、KMP做法
#include <iostream>
using namespace std;
const int N = 100010, M = 1000010;
int n, m;
int ne[N];
char s[M], p[N];
int main()
{
cin >> n >> p + 1 >> m >> s + 1;
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
for (int i = 1, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == n)
{
printf("%d ", i - n);
j = ne[j];
}
}
return 0;
}
kmp时间复杂度为O(n);
四、KMP算法
1、创造ne数组
对p串寻找循环的字串,或者说寻找相同的元素进行标记
也就是创造ne[N]数组;
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];//寻找p[i]==p[j+1]的点,
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
解释:j指针相当于p串自己的指针,i指针去寻找与j+1所指元素相同的元素,给此位置的ne数组标记是i;如果j不为零时,说明i所指子串与j有重复,如果有不重复的点时,让j回到上一个重复j的点也就是ne[j],如果没有重复其实也是ne[j],此时ne[j]=0;
2、匹配操作
for(int i = 1, j = 0; i <= m; i++)
{
while(j && s[i] != p[j+1]) j = ne[j];
if(s[i] == p[j+1]) j++;
if(j == n) //满足匹配条件,打印开头下标, 从0开始
{
//匹配完成后的具体操作
//如:输出以0开始的匹配子串的首字母下标
//printf("%d ", i - m); (若从1开始,加1)
j = ne[j]; //再次继续匹配
}
}
解释:j如果大于零,并且所指元素并不和i指的元素相同时,让j回到上一个相同的元素,也就是j = ne[j];j指针所指时模板串p的元素;如果有相同元素,就让j ++;如果j==n,说明满足匹配,输出结果,令j回到上一个和p[j]相同的元素,也就是ne[j];