刷leetcode,把KMP复习了一下,参考一些博客按自己的理解图解了一下:
- "部分匹配表-Next"
首先,要了解两个概念:"前缀"和"后缀"。 "前缀"指除了最后一个字符以外,一个字符串的全部头部组合;"后缀"指除了第一个字符以外,一个字符串的全部尾部组合。
"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。
设字符串中第i位以前子串的部分匹配值为Next[i]
已知图1中两块黑色范围为第i位所对应的最长公共前后缀,长度为Next[i];
求图1中第i+1位所对应的最长公共前后缀;
1.若图中绿色部分第i位和第Next[i]位相同,则第i+1位所对应的最长公共前后缀为黑色部分+绿色部分,长度为Next[i]+1;
2.若图中绿色部分第i位和第Next[i]位不相同
(1)对于前面的黑色部分,可以划分成图2中前面蓝色部分,该部分为第Next[i]位前面的子串,则其最长公共前后缀长度为Next[Next[i]];
(2)因为图1中两块黑色部分完全相同,所以后面黑色部分也可以划分成相同的蓝色区域,如图2后面,深蓝色部分都是相同子串;
(3)
(3.1)图2中,若第i位和前面浅蓝色第Next[Next[i]]位a相同,则两个红色花括号部分完全相同,即第i+1位前面子串的最长公共前后缀,长度为Next[Next[i]]+1
(3.2)图2中,若第i位和前面浅蓝色第Next[Next[i]]位a不相同,则可以将图2中第一个以及i为前面a、b两块深蓝色区域,按步骤(2)进一步划分,直至划分后长度为0
- 匹配
计算出"部分匹配表-Next"后就可以进行匹配了,需要从字符串haystack中找到needle的位置
匹配过程中,若haystack[b]!=needle[i],则将haystack向前移到b-Next[i]位,并从haystack[b]与needle[Next[i]]开始比较,直至haystack结束(未找到,返回-1)或者needle结束(找到,返回位置)
- 算法实现
实现可能不过简洁,主要得自己理解上面的算法过程
void partialMatchTable(char *needle, int *next){
next[0] = 0;
if(needle[1]){ next[1] = 0; }else{ return; }
if(needle[2]){
next[2] = needle[0]==needle[1]?1:0;
}else{
return;
}
int i = 2;
int nexti = next[2];
while(needle[i+1]){
while(nexti>0 && needle[i]!=needle[nexti]){
nexti = next[nexti];
}
next[i+1] = (needle[i]==needle[nexti])?(nexti+1):0;
i++;
nexti = next[i];
}
}
int KMP(char * haystack, char * needle){
if(needle[0]=='\0') return 0;
int needleLen = strlen(needle);
int *next = (int*)malloc(needleLen*sizeof(int));
partialMatchTable(needle, next);
char* h = haystack;
char* n = needle;
int a = 0;
int b = a;
int i = 0;
while(h[a])
{
while(n[i] && h[b]==n[i]){
b++;
i++;
}
if(n[i]=='\0') return a;
if(a==b){
a++;
b = a;
}else{
a = b-next[i];
}
i = next[i];
}
return -1;
}
- 参考
https://kb.cnblogs.com/page/176818/