暴力匹配算法
是指若i=1指向主串的首地址,j=1指向模式串的首地址,此后则开始匹配 i、j 所指向的对应字符是否匹配,若匹配则匹配下一个对应字符,反之,主串的i指向第一次匹配的下一个字符,即 i=2,模式串j指向其首地址。重复上述步骤;
KMP算法
KMP算法与暴力匹配算法最大的不同就是主串的指针 i 不需要回溯,KMP算法中最重要的就是next数组,next数组所求解的即第j个字符的前j-1个字符组成的字符串的最大相同前后缀+1;
改进的KMP算法
改进的KMP算法其本质上就是对于next数组的优化,即nextval数组,这里的改进针对的是那种几个相同字符连在一起的字符串,如“aaaaaab”;
具体代码如下:
#include<bits/stdc++.h>
using namespace std;
#define Maxsize 100
typedef struct {
char ch[Maxsize];
int length;
}Sstring;
void Initstring(Sstring& S) //初始化,这里为处理方便,不使用ch【0】
{
for (int i = 0; i < Maxsize; i++)
S.ch[i] = '\0';
S.length = 0;
}
void Setstring(Sstring& S, string t) //将字符串t复制到S的后面
{
int len = t.length();
for (int i = 0; i < len; i++)
S.ch[ i + 1] = t[i];
S.length = len;
}
void Indexstring(Sstring T, Sstring t) //暴力匹配,T是主串,t是模式串
{
int i = 1, j = 1;
while (j <= t.length && i<= T.length)
{
if (T.ch[i] == t.ch[j])
{
i++;
j++;
}
else
{
i = i - j + 2;
j = 1; //匹配不成功,模式串指针回退到起始,主串指针+1
}
}
j = j - 1;
if (j == t.length)
cout << "匹配成功!" << endl;
else
cout << "匹配失败!" << endl;
}
void Next(Sstring T, int next[]) //求next数组
{
next[1] = 0; //直接规定next【1】为0
int i = 1,j = 0; //i可以看作是指向主串当前正在匹配字符的指针,j是指向模式串当前正在匹配字符的指针
while (i<T.length) //这里next数组只是对于前length-1个字符的指向,最后一个字符无影响
{
if (j == 0 || T.ch[i] == T.ch[j])
next[++i] = ++j; //j=0意思是前i-1个字符组成的字符串无
else
j = next[j];
}
}
void KMP(Sstring T, Sstring t, int next[])
{
int i = 1, j = 1;
while (i <= T.length && j <= t.length)
{
if (j == 0 || T.ch[i] == t.ch[j]) //主串和模式串对应位置匹配,则匹配下一个对应位置
{
++i;
++j;
}
else//如果主串和模式串对应位置不匹配,则主串指针不变,模式串指针调到对应next数组位置
j = next[j];
}
if (j - 1 == t.length)
cout << "匹配成功!" << endl;
if(j-1!=t.length)
cout << "匹配失败!" << endl;
}
void Nextval(Sstring T, int nextval[]) //改进的nextval数组是对于类似aaaab型的模式串的改进,节省了重复无意义的步骤
{
nextval[1] = 0;
int i = 1,j = 0;
while (i < T.length)
{
if (j == 0 || T.ch[i] == T.ch[j])
{
++i;
++j;
if (T.ch[i] != T.ch[j])
nextval[i] = j;
else //如果Pj=Pnext[j],则Pj=Pnext[next[j]]
nextval[i] = nextval[j];
}
else
j = nextval[j];
}
}
int main()
{
Sstring T, t; //T是主串,t是模式串
Initstring(T);
Initstring(t);
string T1, t1;
cout << "先输入主串,再输入模式串:" << endl;
cin >> T1>>t1;
Setstring(T, T1);
Setstring(t, t1);
cout << "暴力匹配算法:" << endl;
cout << T.length << " " << t.length << endl;
Indexstring(T, t); //暴力匹配
cout<<endl;
cout << "KMP匹配算法:" << endl;
int next[100];
Next(t, next);
for (int i = 0; i < t.length; i++) {//打印next数组
cout << "next[" << i + 1 << "]" << ":" << next[i+1]<<" ";
}
cout << endl;
KMP(T, t, next);
cout << endl;
cout << "改进的KMP匹配算法:" << endl;
int nextval[100];
Nextval(t, nextval);
for (int i = 0; i < t.length; i++) {//打印next数组
cout << "nextval[" << i + 1 << "]" << ":" << nextval[i + 1] << " ";
}
cout << endl;
KMP(T, t, nextval);
return 0;
}