1、kmp模式匹配法
1.1、next数组思想
(1)这里对大话数据结构进行改进,next数组的取值方式不一样,因为string数组进行初始化,都是从0下标开始的,所以这里也是从0开始。
(2)next数组的第一个为-1
(3)若相同则都往前走,且next数组置为j所走的次数 若不同,则j回到next[j],这样比回到0高效率,在次比较
(4)若还是不同,回到0,若还是不同,那么i向前走,j不动
(5)改进算法是由于这种情况引起的如aaaaaab那么当b不匹配时会回到倒数第一个a,然后不断回到第一个a。改进后的算法是,可以直接回到第一个a进行比较,因为中间的都一样,是不必要比较了的。下面是改进后的代码,黑体部分为修改部分。
1.2、kmp匹配思想
(1)要求:获取从第pos个字符开始,S和T匹配的位置
(2)不断比较,若不同,则退回到next[j]
实现程序如下:
#include<iostream>
using namespace std;
void get_next(string T,int *next)
{
int i=0,j=-1;//
next[0]=-1;
while(i<T.length()-1)
{
if(j==-1||T[j]==T[i])
{
j++;
i++;
if(T[j]!=T[i])
next[i]=j;//这里的j又充当了临时计数器的效果
else
next[i]=next[j];//若下一个还是相同则将其向前跳</strong>
}
else
{
j=next[j];
}
}
/*for(int a=0;a<T.length();a++)//对于数组的显示,这里需要下次再仔细看一下
{
next[a]++;
cout<<next[a]<<" ";
}*/
}
int Index_kmp(string S,string T,int pos)
{
int i=pos;
int j=-1;
int *next=new int[T.length()]();
get_next(T,next);
int LS=S.length();
int LT=T.length();
while(i<LS && LT>j)// && (j<T.length()
{
if(j==-1 || S[i]==T[j])
{
i++;
j++;
}
else
{
j=next[j];
}
}
delete next;
if(j>=T.length())//表示匹配成功
return i-T.length();
else
return -1;
}
int main()
{
string a="abaa";
string b="afdfdsfsabaabaa";
int pos=2;
int back=Index_kmp(b,a,pos);
cout<<"the pos is"<<back<<endl;
system("pause");
}
输出:
the pos is8
请按任意键继续. . .
请按任意键继续. . .