字符串的模式匹配问题可以简单描述为,判断主串中是否包含子串,如果包含,要给出第1次出现子串的位置。比如,主串为believe,子串为lie,那么主串就包含子串,第1次出现的位置是在主串的第3个字符处。
朴素的模式匹配算法是进行两重循环,主串、子串分别从第1位开始,逐字比较。如果遇到不同字符,则子串重新回到第1位,与主串的第2位开始进行逐字比较,以此类推。记主串、子串长度分别为m和n,则该算法的复杂度为O(mn)。
朴素算法中,主串、子串都进行了回溯。而KMP算法对主串不回溯,仅对子串回溯,而且也不一定回溯到子串的开头。也就是说,如果比较到某一位不相同,主串的游标仍定格在这里,子串的游标回溯到前面某一位(不一定是开头),来重新与主串的该位进行对比。那么,子串究竟该回溯到哪一位,取决于子串自身的构造,我们把这个“哪一位”记为next。这部分代码如下:
//获得子串第1次在主串中出现的位置
int GetPosition(const char *p, const char *q)
{
int i, j;
int length_p, length_q;
int next[MAX_SHORT];
i = 0;
j = 0;
length_p = strlen(p);
length_q = strlen(q);
GetNextValue(q, next);
while (i < length_p)
{
if (j ==