在百度中,看到了不少关于KMP算法的介绍。
普通的粗暴方式的时间复杂度一度飙到O(NM),而KMP算法所耗费的时间复杂度降到了O(N+M),这可以说是一个壮举。
而粗暴的处理方式也称为BF算法,这种算法很容易想明白,BF算法的思想就是将目标串S的第一个字符与模式串P的第一个字符进行匹配,若相等,则继续比较S的第二个字符和P的第二个字符;若不相等,则比较S的第二个字符和P的第一个字符,依次比较下去,直到得出最后的匹配结果。
举例说明:
S: ababcababa
P: ababa
BF算法匹配的步骤如下
i=0 i=1 i=2 i=3 i=4
第一趟:ababcababa 第二趟:ababcababa 第三趟:ababcababa 第四趟:ababcababa 第五趟:ababcababa
ababa ababa ababa ababa ababa
j=0 j=1 j=2 j=3 j=4(i和j回溯)
i=1 i=2 i=3 i=4 i=3
第六趟:ababcababa 第七趟:ababcababa 第八趟:ababcababa 第九趟:ababcababa 第十趟:ababcababa
ababa ababa ababa ababa ababa
j=0 j=0 j=1 j=2(i和j回溯) j=0
i=4 i=5 i=6 i=7 i=8
第十一趟:ababcababa 第十二趟:ababcababa 第十三趟:ababcababa 第十四趟:ababcababa 第十五趟:ababcababa
ababa ababa ababa ababa ababa
j=0 j=0 j=1 j=2 j=3
i=9
第十六趟:ababcababa
ababa
j=4(匹配成功)
代码实现:
int BFMatch(char *s,char *p)
{
int i,j;
i=0;
while(i<strlen(s))
{
j=0;
while(s[i]==p[j]&&j<strlen(p))
{
i++;
j++;
}
if(j==strlen(p))
return i-strlen(p);
i=i-j+1; //指针i回溯
}
return -1;
}
又因为BF算法的时间局限性,三位大咖(***、***、***)又发明了KMP算法。效率极高但不容易理解,现在也是晕晕乎乎不明不白的,先把知识点摆上以后慢慢理解。
KMP算法推荐文章:
http://blog.csdn.net/v_july_v/article/details/7041827# 大神的存在
http://www.matrix67.com/blog/archives/115
http://billhoo.blog.51cto.com/2337751/411486
http://www.cnblogs.com/dolphin0520/archive/2011/08/24/2151846.html
留着以后慢慢理解。
附上一道山东理工ACM中关于KMP的题目 3311——数据结构实验之串三:KMP应用
Problem Description
有n个小朋友,每个小朋友手里有一些糖块,现在这些小朋友排成一排,编号是由1到n。现在给出m个数,能不能唯一的确定一对值l和r(l <= r),使得这m个数刚好是第l个小朋友到第r个小朋友手里的糖块数?
Input
首先输入一个整数n,代表有n个小朋友。下一行输入n个数,分别代表每个小朋友手里糖的数量。
之后再输入一个整数m,代表下面有m个数。下一行输入这m个数。
Output
如果能唯一的确定一对l,r的值,那么输出这两个值,否则输出-1
Example Input
5
1 2 3 4 5
3
2 3 4Example Output
2 4
Hint
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
const int maxn=100000000+1000;
int next[maxn];
int a[maxn], b[maxn];
void getnext(int len)///寻找每个位置的最大公共子缀的长度
{
int i=0,j=-1;
next[0]=-1;
while(i<len)
{
if(j==-1||b[i]==b[j])
{
i++;
j++;
next[i]=j;
}
else
{
j=next[j];
}
}
}
int kmp(int lena, int lenb, int p)
{
getnext(lenb);
int i=p, j=0;
while(i<lena&&j<lenb)
{
if(j==-1||a[i]==b[j])
{
i++;
j++;
}
else
{
j=next[j];
}
}
if(j==lenb)
return i-lenb+1;
else
return -1;
}
int main()
{
ios::sync_with_stdio(false);
int n, m;
while(cin>>n)
{
for(int i=0;i<n;i++)
cin>>a[i];
cin>>m;
for(int i=0;i<m;i++)
cin>>b[i];
int x=kmp(n, m, 0);///需要判断两次,因为题意是是唯一确定的一对l和r;
if(x!=-1)
{
int k=kmp(n, m, x+m-1);
if(k==-1)
cout<<x<<" "<<x+m-1<<endl;///输出的是数组下标,并不是数组值
else
cout<<"-1"<<endl;
}
else
cout<<"-1"<<endl;
}
return 0;
}