F03 KMP和KMP自动机

注:所有的字符串从1开始,ac代码不同是因为提交时间不同,间隔较长方法未统一

更好的阅读体验?

作用

在字符串中查找子串

实现

构建(build)

双指针,用i扫描原字符串S,用j扫描匹配匹配串T

期间用了一个前缀函数,也就是我们常说的next数组,用来了记录S.substr(0, i)的最长相等真前后缀长度

如何构建?我们定义nt[i]是S.substr(0, i)的最长相等真前后缀长度,且nt[i]=j

因为是真前后缀,所以i从2开始,而对于j我们采取预判操作

(1)如果S[i]=S[j+1],让j+1,说明两者匹配

(2)如果不相等,我们令j回跳为nt[j],直到j的预判(下一个)使得S[i]=S[j+1]

ne[1] = 0;
for (int i = 2, j = 0; i <= n; i ++ ) {
    while (j && s[i] != s[j + 1]) j = ne[j];
    if (s[i] == s[j + 1]) j += 1;
    ne[i] = j;
}

匹配(KMP)

如果我们会构建next数组的话,匹配的过程跟构建其实是一致的

只不过是在两个字符串上进行操作

这次是匹配了,i从1开始,j还是进行预判

(1)如果S[i] = T[j+1],说明两者匹配,j+1

(2)如果不相等,我们令j回跳为nt[j],直到j的预判(下一个)使得S[i]=T[j+1]

for (int i = 1, j = 0; i <= n; i ++ ) {
    while (j && s[i] != t[j + 1]) j = ne[j];
    if (s[i] == t[j + 1]) j += 1;
    if (j == n) t字符串的最后一个字符匹配成功
}

应用+题目

在字符串中查找子串

【模板】KMP - 洛谷

https://codeforces.com/contest/1968/problem/G1

ac代码

#include <bits/stdc++.h>
#define int long long
#define endl '\n'
using namespace std;
typedef pair<int, int> PII;
vector<int> nt;
void build(string &s) {
	int n = s.size();
	vector<int> pi(n);
	for (int i = 1; i < n; i ++ ) {
		int j = pi[i - 1];
		while (j > 0 && s[i] != s[j]) j = pi[j - 1];
		if (s[i] == s[j]) j += 1;
		pi[i] = j;
	}
	nt = pi;
}
int KMP(string &t, string &s) {
	build(s);
	int n = t.size(), m = s.size(), j = 0;
	int last = -1e9, ans = 0;
	for (int i = 0; i < n; i ++ ) {
		while (j > 0 && t[i] != s[j]) j = nt[j - 1];
		if (t[i] == s[j]) j += 1;
		if (j == m) {
			int head = i - m + 1;
			if (head >= last + m) {
				ans += 1;
				last = head;
			}
		}
	}
	return ans;
}
void solve() {
	int n, k; cin >> n >> k >> k;
	string s; cin >> s;
	int l = 0, r = n / k + 1;
	while (l + 1 != r) {
		int mid = l + r >> 1;
		string p = s.substr(0, mid);
		if (KMP(s, p) >= k) l = mid;
		else r = mid;
	}
	cout << l << endl;
}
signed main() {
	ios::sync_with_stdio(0);
	cin.tie(0); cout.tie(0);
	int tt; cin >> tt;
	while (tt -- ) solve();
	return 0;
}

字符串周期

[BOI2009] Radio Transmission 无线传输 - 洛谷

如果S有r的border,说明|S|-r是S的周期

KMP自动机

作用

提高匹配效率

实现

一:前缀函数(同之前的next数组)

for (int i = 2, j = 0; i <= m; i++) {
    while (j && t[i] != t[j + 1]) j = pi[j];
    if (t[i] == t[j + 1]) j++;
    pi[i] = j;
}

二:aut转移矩阵
遍历到i的位置,匹配完1~i-1后,遇到字符c所在的状态

构造
for (int i = 1; i <= m; i ++ ) {
        for (int c = 0; c < 26; c ++ ) {
            if (i > 1 && t[i] != 'a' + c) {
                aut[i][c] = aut[pi[i - 1] + 1][c];
            }else {
                aut[i][c] = i + (t[i] == 'a' + c);
            }
        }
    }

末尾加上一个#,统一最后的情况,并且也方便统计文本串

  • 一般情况:
    • 如果当前的字符 t[i] 和即将要匹配的字符 'a' + c 不同(即 t[i] != 'a' + c),则我们需要查找最长的相同前缀继续匹配。这就是 aut[i][c] = aut[pi[i - 1] + 1][c] 的来源。
  • 特殊情况:
    • 如果当前的字符 t[i] 和即将要匹配的字符 'a' + c 相同(即 t[i] == 'a' + c),这表示当前字符可以匹配成功,因此直接转移到下一个状态 i + 1
    • 公式 aut[i][c] = i + (t[i] == 'a' + c) 表示:
      • 如果 t[i] == 'a' + c,则转移到 i + 1(即模式串前进一个位置)。
      • 如果 t[i] != 'a' + c,则状态保持为 i,这个状态是已经匹配 i-1 个字符的状态,需要通过 pi 前缀函数找出可能的部分匹配。

题目

https://codeforces.com/contest/808/problem/G

ac代码

#include <iostream>
#include <vector>
#include <cstring>
using namespace std;
const int N = 1e5 + 9;
int aut[N][26], dp[2][N], pi[N];
int main() {
    ios::sync_with_stdio(0);
    cin.tie(0);
    string s, t; cin >> s >> t;
    int n = s.size(), m = t.size() + 1;
    s = ' ' + s, t = ' ' + t + '#';
    for (int i = 2, j = 0; i <= m; i ++ ) {
        while (j && t[i] != t[j + 1]) j = pi[j];
        if (t[i] == t[j + 1]) j += 1;
        pi[i] = j;
    }
    for (int i = 1; i <= m; i ++ ) {
        for (int c = 0; c < 26; c ++ ) {
            if (i > 1 && t[i] != 'a' + c) {
                aut[i][c] = aut[pi[i - 1] + 1][c];
            }else {
                aut[i][c] = i + (t[i] == 'a' + c);
            }
        }
    }
    memset(dp, 0xcf, sizeof(dp));
    dp[0][1] = 0;
    for (int i = 1; i <= n; i ++ ) {
        if (s[i] == '?') {
            for (int j = 1; j <= m; j ++ ) {
                for (int c = 0; c < 26; c ++ ) {
                    dp[i & 1][aut[j][c]] = max(dp[i & 1][aut[j][c]], dp[(i - 1) & 1][j] + (aut[j][c] == m));
                }
            }
        }else {
            for (int j = 1; j <= m; j ++ ) {
                dp[i & 1][aut[j][s[i] - 'a']] = max(dp[i & 1][aut[j][s[i] - 'a']], dp[(i - 1) & 1][j] + (aut[j][s[i] - 'a'] == m));
            }
        }
        for (int j = 1; j <= m; j ++ ) dp[(i - 1) & 1][j] = -0x3f3f3f3f;
    }
    int ans = 0;
    for (int i = 1; i <= m; i ++ ) ans = max(dp[n & 1][i], ans);
    cout << ans << endl;
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值