接上一篇not-so-native算法
点击传送
KMP算法是D.E.Knuth、J.H.Morris和V.R.Pratt发现的一个字符串匹配算法;
核心思想就是:
1,先对子串进行预处理,找出前面当前位置的字母在位置之前最近的相同字母的位置,没有就是从前一个字母的的前序相似字母位置加一开始;这样一组位置数据存在next数组中;
2,在比较算法中如果有重复字母出现,可以用next数组来减少前序比较。
下面是next数组代码
int* getNext(string _substr)
{
int len=_substr.size();
int *next=new int[len];
next[0]=-1;//赋值为-1,是为了后续循环i能往后移
int i=0,j=-1;
while(i<len-1)
{
if(j==-1||_substr[i]==_substr[j])//有相等的情况或者j==-1时向后移
{
j++;
i++;
next[i]=j;
}
else
j=next[j];//从前一字母的记录位置起
}
return next;
}
下面是寻找位置的代码
int getSubStr(string base,string _substr)
{
int i=0,j=0;
int *next=getNext(_substr);
int len_1=base.size();
int len_2=_substr.size();
while(i<len_1&&j<len_2)
{
if(j == -1||base[i]==_substr[j])
{
i++;
j++;
}
else
j=next[j];
}
if(j==len_2)
return i-j;
else
return -1;
}
测试代码
int main()
{
string str1="asdfgsdjlgakjpabcd0eowinkf";
string str2="abcd";
cout<<getSubStr(str1,str2)<<endl;
string str3="asdfgsdjlgakjpaacd0eowinkf";
string str4="aacd";
cout<<getSubStr(str3,str4)<<endl;
return 0;
}
测试结果