7-1 串的模式匹配 (KMP算法)

7-1 串的模式匹配 (100分)

给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。

本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:

  • 数据0:小规模字符串,测试基本正确性;
  • 数据1:随机数据,String 长度为 10​5​​,Pattern 长度为 10;
  • 数据2:随机数据,String 长度为 10​5​​,Pattern 长度为 10​2​​;
  • 数据3:随机数据,String 长度为 10​5​​,Pattern 长度为 10​3​​;
  • 数据4:随机数据,String 长度为 10​5​​,Pattern 长度为 10​4​​;
  • 数据5:String 长度为 10​6​​,Pattern 长度为 10​5​​;测试尾字符不匹配的情形;
  • 数据6:String 长度为 10​6​​,Pattern 长度为 10​5​​;测试首字符不匹配的情形。

输入格式:

输入第一行给出 String,为由英文字母组成的、长度不超过 10​6​​ 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 10​5​​ 的字符串。每个字符串都非空,以回车结束。

输出格式:

对每个 Pattern,按照题面要求输出匹配结果。

输入样例:

abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz

输出样例:

abcabcacabxy
Not Found
Not Found

 KMP 算法详解 - 知乎 (zhihu.com)

#include<iostream>
#include<cstring>
#include<algorithm>
#include<vector>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<cmath>
#include<unordered_map>
//1009;
using namespace std;
typedef long long ll;
const int inf = 99999999;
string t;
string s;
int n;
int dp[10000][256];
void kmp(string t) {
	int m = t.size();
	int x = 0;
	memset(dp, 0, sizeof(dp));
	dp[0][t[0]-'0'] = 1;
	for (int i = 1; i < m; i++) {
		for (int j = 0; j < 256; j++) {
			dp[i][j] = dp[x][j];
		}
		dp[i][t[i] - '0'] = i + 1;
		x = dp[x][t[i] - '0'];
	}
}
int search(string s) {
	int index = 0;
	for (int i = 0; i < s.size(); i++) {
		index = dp[index][s[i] - '0'];
		if (index == t.size()) return i - t.size() + 1;
	}
	return -1;
}
int main() {
	cin >> s;
	cin >> n;
	while (n--) {
		cin >> t;
		kmp(t);
		int index=search(s);
		if (index == -1) cout << "Not Found" << endl;
		else {
			for (int i = index; i < s.size(); i++) {
				cout << s[i];
			}
			cout << endl;
		}
	}
	return 0;
}

 dp数组开不到最大,不知道咋开,求解?

 

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
BF算法KMP算法都是模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主和模式的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式较长时,KMP算法的效率更高。 下面是BF算法KMP算法的介绍和演示: 1. BF算法(暴力匹配算法) BF算法是一种朴素的模式匹配算法,它的思想是从主的第一个字符开始,依次和模式的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主的下一个字符开始重新匹配。BF算法的时间复杂度为O(m*n)。 下面是BF算法的Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法(Knuth-Morris-Pratt算法KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式与主的匹配次数。具体来说,KMP算法通过预处理模式,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法的Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值