831. KMP字符串(KMP,模板题,@next数组详解)

活动 - AcWing

给定一个字符串 S,以及一个模式串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模式串 P 在字符串 S 中多次作为子串出现。

求出模式串 P 在字符串 S 中所有出现的位置的起始下标。

输入格式

第一行输入整数 N,表示字符串 P 的长度。

第二行输入字符串 P。

第三行输入整数 M,表示字符串 S 的长度。

第四行输入字符串 S。

输出格式

共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。

数据范围

1≤N≤105
1≤M≤106

输入样例:
3
aba
5
ababa
输出样例:
0 2

解析: 

在介绍next数组之前先来引入两个概念:
一个字符串:c[1],c[2],c[3],c[4],c[5],……,c[n-3],c[n-2],c[n-1],c[n]
前缀:指从字符串的开头开始,一直到任意位置的连续子串,如:(c[1]),(c[1],c[2]),(c[1],c[2],c[3]),(c[1],c[2],c[3],c[4],c[5],……,c[n-3],c[n-2])等都是前缀

后缀:指从字符串的任意位置开始,一直到字符串的末尾的连续子串,如:(c[n]),(c[n-1],c[n]),(c[n-3],c[n-2],c[n-1],c[n]),(c[k],……,c[n-3],c[n-2],c[n-1],c[n])等,其中1<=k<=n-3.

最长公共前后缀:指一个字符串的前缀和后缀相同的最长长度。
举个例子,对于字符串 "abcabc", 它的前缀有:"a", "ab", "abc", "abca", "abcab", "abcabc",后缀有:"c", "bc", "abc", "cabc", "bcabc", "abcabc"。可以看到,"abc" 是既是前缀也是后缀的最长子串,它的长度为3,所以 "abcabc" 的LCPS为3。

现在就可以从dp的角度理解next数组了。
ne[i]:表示字符串中以 i 结尾的后缀的最长公共前后缀中前缀的结束位置

这个在字符串匹配中由于前缀和后缀一样,因此我们可以跳过前缀,直接从前缀结束的位置开始匹配,大大提高匹配的效率。

ne数组的预处理

for (int i = 2, j = 0; i <= n; i++) {
        while (j && p[i] != p[j + 1])j = ne[j];//如果j>0即j还能缩小,且p[i]!=p[j+1],那么j跳回到当前j的最大公共前缀位置
        if (p[i] == p[j + 1])j++;//否则j++
        ne[i] = j;//当前位置i的最大公共前后缀的长度为j

}


匹配:
 

for (int i = 1, j = 0; i <= m; i++) {
        while (j && s[i] != p[j + 1])j = ne[j];//如果j>0即j还能缩小,且p[i]!=p[j+1],那么j跳回到当前j的最大公共前缀位置
        if(s[i]==p[j+1])j++;
        if (j == n) {
            printf("%d ", i-n);//输出每次匹配成功的起始位置
            j = ne[j];
        }
}

完整代码: 

#include<iostream>
#include<string>
#include<cstring>
#include<cmath>
#include<ctime>
#include<algorithm>
#include<utility>
#include<stack>
#include<queue>
#include<vector>
#include<set>
#include<math.h>
#include<map>
#include<sstream>
#include<deque>
#include<unordered_map>
#include<unordered_set>
#include<bitset>
using namespace std;
typedef long long LL;
typedef unsigned long long ULL;
typedef pair<int, int> PII;
typedef pair<long long, long long> PLL;
typedef pair<double, double> PDD;
const int INF = 0x3f3f3f3f;
const LL Mod = 1e9;
const int N = 1e6 + 10, M = 1e5 + 10, P = 110;
int n, m;
int ne[N];
char s[N], p[N];

int main() {
	scanf("%d%s", &n, p + 1);
	scanf("%d%s", &m, s + 1);
	for (int i = 2, j = 0; i <= n; i++) {
		while (j && p[i] != p[j + 1])j = ne[j];
		if (p[i] == p[j + 1])j++;
		ne[i] = j;
	}

	/*cout << "________________" << endl << endl;
	for (int i = 1; i <= n; i++) {
		printf("%d ", ne[i]);
	}
	cout << endl;
	cout << endl;*/


	for (int i = 1, j = 0; i <= m; i++) {
		while (j && s[i] != p[j + 1])j = ne[j];
		if(s[i]==p[j+1])j++;
		if (j == n) {
			printf("%d ", i-n);
			j = ne[j];
		}
	}
	return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值