一、字符串总结
https://www.processon.com/v/654322ea94ee25571ada9132
二、双指针法
https://www.processon.com/v/6543596620d3411d2e47ff49
三、KMP算法
KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了。
1、前缀表
前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。
2、前后缀
前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串;后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。
例子:长度为前1个字符的子串a
,最长相同前后缀的长度为0。
长度为前2个字符的子串aa
,最长相同前后缀的长度为1。
长度为前3个字符的子串aab
,最长相同前后缀的长度为0。
长度为前4个字符的子串aaba
,最长相同前后缀的长度为1
长度为前5个字符的子串aabaa
,最长相同前后缀的长度为2。
长度为前6个字符的子串aabaaf
,最长相同前后缀的长度为0。
可以看出模式串与前缀表对应位置的数字表示的就是:下标i之前(包括i)的字符串中,有多大长度的相同前缀后缀。
3、利用前缀表
①找到的不匹配的位置, 那么此时我们要看它的前一个字符的前缀表的数值是多少。
②前一个字符的前缀表的数值是2, 所以把下标移动到下标2的位置继续比配。
③在文本串中找到了和模式串匹配的子串了。
4、前缀表与next数组
next数组既可以就是前缀表,也可以是前缀表统一减一(右移一位,初始位置为-1)。
构造next数组其实就是计算模式串s,前缀表的过程。 主要有如下三步:
1、初始化
2、处理前后缀不相同的情况
3、处理前后缀相同的情况