1.KMP算法:
串的模式匹配算法(用来求子串在主串中的位置);
简单的模式匹配算法:
其中KMP算法可以解决朴素模式匹配算法的缺点,当子串和模式串不匹配时,主指针i不回溯, 模式串指针j=next[j] 算法平均时间复杂度为0(m+n)
子串变化公式:
利用子串的部分匹配值快速进行字符串匹配操作,公式:“移动位数=已匹配的字符数-对应的部分匹配值”.
在KMP算法中,改进公式:右移位数=已匹配的字符数-对应的部分匹配值
即:Move=(j-1)-PM[j-1],
这个式子最后得到子串指针变化公式: j=next[j]
next[j]的含义是:在子串的第j个字符与主串发生匹配失败时,则跳到子串的next[j]位置重新与主串当前位置进行比较.
如何求next数组:
一般来说,next[1]=0,next[2]=1的
核心点就是求next[j]:next[j]=s的最长相等前后缀长度+1
代码实现:
尽管普通模式匹配的时间复杂度为O(mn),KMP算法的时间复杂度为O(m+n),但在一般情况下,普通模式的匹配的实际执行时间近似为O(m+n),因此至今仍被使用。KMP算法仅在主串与子串有很多“部分匹配”时才显得比普通算法快很多,其主要优点是主串不回溯。
2.KMP算法优化:
有可能会多几次毫无意义的比较
模式:aaaab 和 主串:aaabaaaab进行匹配时:
从左往右进行比较,一定要先求出next[j],然后看模式串的next【j】的值对应的序号是否与模式串对应的字符相同,若相同则赋之前的值,不同就是next【j】的值。