strstr:一个字符串在另一个字符串中出现的位置。
我们将第一个字符串称为匹配串,第二个字符串称为主串
在整个KMP过程中主串不回头(即向后走或者停止)
KMP中最终要的环节就是Next数组:
根据前缀,和后缀,找到最大相同的串即该位的next数组值。
举个例子:(字符串的前缀和后缀不能为本身)
匹配串:abcab 前缀:a ab abc abca (以头开始)
后缀:b ab cab bcab(以尾结束)
该串的最大相等长度为ab 为 2。
a b c a b c d a b c a b c f
0 0 0 1 2 3 0 1 2 3 4 5 6 0
求next数组主要分为3步
j = i-1
str[i] 与 str[next[j]]
1. 相等 next[i] = next[j]+1;
2.不相等 且 next[i-1] = 0 (说明和第一个比较过了,与前面的字符串没有相等的可能) 例如:下标为2的c,与下标为0的a比较,不相等,next[2] = 0;
next[i] = 0;
3.不满足1,2 不相等并且next[j] != 0 例如:f先与下标为6的d比较不相等,再与下标为3的a比较不相等,next[2]为0,所以f位为0
j = next[j] - 1;
重复上述过程,遍历字符串
getNext函数:
int* GetNext(char* st) { int len = strlen(st); int* next = (int*)malloc(sizeof(int)*len); memset(next,0,sizeof(next)); int i = 1; int j = i-1; while(i<len) { if(st[i] == st[next[j]]) { next[i] = next[j]+1; i++; j = i-1; } else if(next[j] == 0) { next[i] = 0; i++; j = i-1; } else { j = next[j]-1; } } return next; }
KMP代码:
#include <stdio.h> #include <stdlib.h> #include <string.h> int* GetNext(char* st) { int len = strlen(st); int* next = (int*)malloc(sizeof(int)*len); memset(next,0,sizeof(next)); int i = 1; int j = i-1; while(i<len) { if(st[i] == st[next[j]]) { next[i] = next[j]+1; i++; j = i-1; } else if(next[j] == 0) { next[i] = 0; i++; j = i-1; } else { j = next[j]-1; } } return next; } int KMP(char* str,char* st,int* next) { int mark1 = 0; int mark2 = 0; int len1 = strlen(str); int len2 = strlen(st); while(mark1<len1 && mark2 < len2) { if(str[mark1] == st[mark2])//相等 { mark1++; mark2++; } else//不相等 { if(mark2 == 0)//匹配串的第一个与主串不相等那么主串向后走 mark1++; else mark2 = next[mark2-1];//匹配串跳到前一个下标的next值位置 //(mark2:我和你不相等,但当初我和next[mark-1]的位置比较时也不相等,你去看看你俩相不相等,相等的话就从那个位置继续向下比) } } if(mark2 == len2)//匹配串到了最后说明找到了 return mark1-mark2; if(mark1 == len1)//主串找到最后说明没找到 return -1; } int main() { // char* str = "abcabceabcabcdabcabcabcabcdabcabcfabc"; // char* st = "abcabcdabcabcf"; char* str = "abcabceabcabcdabcabcdabcabcfabc"; char* st = "abcabcdabcabcf"; int p ; int* next = GetNext(st); int len1 = strlen(st); p = KMP(str,st,next); printf("%d",p); }