KMP模式匹配算法
为了解决一般匹配算法的低效问题。避免重复的遍历,我们学习一个KMP算法
算法原理
假设主串S=“abcdefg”,要匹配的字符串T=“abcdex”
我们发现a不与后面的子串中任一字符相等。那么对于一般匹配来说,后面的步骤都是多余的。
算法流程如下:
假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置
1.如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++,继续匹配下一个字符;
2.如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]。此举意味着失配时,模式串P相对于文本串S向右移动了j - next [j] 位。
换言之,当匹配失败时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值,即移动的实际位数为:j - next[j],且此值大于等于1。
next 数组各值的含义:代表当前字符之前的字符串中,有多大长度的相同前缀后缀。例如如果next [j] = k,代表j 之前的字符串中有最大长度为k 的相同前缀后缀。
这就意味着在某个字符失配时,该字符对应的next 值会告诉你下一步匹配中,模式串应该跳到哪个位置(跳到next [j] 的位置)。如果next [j] 等于0或-1,则跳到模式串的开头字符,若next [j] = k 且 k > 0,代表下次匹配跳到j 之前的某个字符,而不是跳到开头,且具体跳过了k 个字符。
算法实现
void get_next(string T,int *next)
{