kmp算法是一种字符串匹配算法,时间复杂度为(m+n)。
个人对算法学习还在初级阶段。以前对字符串匹配用暴力匹配算法。
暴力匹配算法
两个字符串,模板串mo[]和文本串s[]。
如果用暴力算法,对于模板串mo[],用i表示模板串匹配的位置。用j表示文本串匹配的位置。
1,如果从一开始匹配的上,i和j同时增加。
2,当在某一位置匹配不上时,模板串从0开始,i=0;模板串往前移,此时,j=j-i+1;;
此时,i回溯,j置为零。
int violent_match(char *a,char *b)
{
int len=strlen(a);
int len2=strlen(b);
int i=0,j=0;
while(i<len&&j<len2)
{
//当匹配时,i和j同时增加
if(a[i]==b[j])
i++,j++;
else
//匹配不成功时i置为零,j回溯为j—i+1;
j=j-i+1,i=0;
}
if(j==len2) return i-j;//返回当前位置 else
return -1;
}
从代码中就已经看到了反复的查找和回溯,时间复杂度大
KMP算法
kmp算法的核心是next的建立,然后是对两个字符串的匹配函数。
next[]数组是对mo[]自身的标记,通过next减少了重复匹配的次数,其中首位ne[0]=-1;
void get_next(char *a,int ne[])
{
int i=0,j=-1;
int ne[0]=-1;
while(j==-1||ne[i]==ne[j])
ne[++i]=ne[++i];
else
j=ne[j];//匹配失败时退回;
}
通过get_next 函数,得到了一个关于如果匹配失败后可以退回后缀已经匹配过前缀相同的地方,;
kmp函数,如果mo串匹配一次后,文本串被匹过不删除的话
int kmp(char a[],char p[],int sum){
get_next(a,ne);
int len = strlen(p);
int len2=strlen(a);
int i=0,j=0;
while(i<len){
while(a[j]!=p[i]&&j!=-1)
j=ne[j];//自身的一个查找,找到ne所回的地方有匹配的或找完(j=-1)才退出循环,如果找不到,i就不增加
i++,j++;
if(j>=len2)
{sum++;
j=ne[j];//这里匹配成功过一次后,j返回重复前缀的地方,
}
}
return sum;
}
对于如果是例如剪花布条题来说,匹配过一次,文本串里匹配的部分就要不能再配了,因此
int kmp(char a[],char p[],int sum){
get_next(a,ne);
int len = strlen(p);
int len2=strlen(a);
int i=0,j=0;
while(i<len){
while(a[j]!=p[i]&&j!=-1)
j=ne[j];//自身的一个查找,找到ne所回的地方有匹配的或找完(j=-1)才退出循环,如果找不到,i就不增加
i++,j++;
if(j>=len2)
{sum++;
j=0;//这里返回的是0,从mo串的第一个开始,
}
}
return sum;
}
对于KMP 算法了解还是很青涩,kmp还有优化方式,了解清楚后会再补充。