题目
(1) 字符串处理
c. 自学 KMP 算法,并上机练习。
KMP算法介绍
KMP算法是一种改进的字符串匹配算法,KMP算法的核心是利用匹配失败后的信息,尽量减模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息,KMP算法的时间复杂度O(m+n),而使用暴力匹配的时间复杂度则是O(mn)。
要解决的问题
Next[]数组
首先我们通常设next[1]=0;之后next[i]就是字符串当前位置前的前缀和后缀的匹配值+1,匹配值就是前缀和后缀的最大相同子串长度。
求Next[]数组算法实现
有利用到递推的思想,具体如下图所示
优化:
我们至此求得的next数组也是有一些不足的,他有的时候会多做一些无意义的比较,所以我们可以对他进行改进获得nextval数组,如果T.ch[next[j]] == T.ch[j]就让nextval[j] = nextval[next[j]];,否则nextval[j] = next[j];
运行结果
源代码
#include <iostream>
#define MAXLEN 255
using namespace std;
//串的数据结构
typedef struct {
char ch[MAXLEN];
int length;
}SString;
//求next数组
void getNext(SString T, int next[]) {
int i = 1, j = 0;
next[1] = 0;
while (i < T.length) {
if (j == 0 || T.ch[i] == T.ch[j]) {
++i;
++j;
next[i] = j;
}
else {//有用到递推的思想
j = next[j];
}
}
}
//改进next数组
void getNextval(SString T, int next[], int nextval[]) {
nextval[1] = 0;
for (int j = 2; j <= T.length; j++) {
if (T.ch[next[j]] == T.ch[j]) {
nextval[j] = nextval[next[j]];
}
else {
nextval[j] = next[j];
}
}
}
//KMP算法
int KMP(SString S, SString T, int next[]) {
int i = 1, j = 1;
while (i <= S.length && j <= T.length) {
if (j == 0 || S.ch[i] == T.ch[j]) {
++i;
++j;
}
else {
j = next[j];
}
}
if (j > T.length) {//匹配成功,返回首字母位置
return i - T.length;
}
else {
return 0;
}
}
int main() {
SString S, T;
cout << "字符串第一位(下标为0的)舍弃不用,不参与比较" << endl;
cout << "输入字符串1:";
cin >> S.ch;
S.length = strlen(S.ch) - 1;
cout << "输入字符串2:";
cin >> T.ch;
T.length = strlen(T.ch) - 1;
int next[MAXLEN];
int nextval[MAXLEN];
//求next数组
getNext(T, next);
//求nextval数组
getNextval(T, next, nextval);
//判断是否匹配
int res = KMP(S, T, nextval);
cout << S.length << endl;
cout << T.length << endl;
if (res != 0) {
cout << "匹配" << endl;
}
else {
cout << "不匹配" << endl;
}
}