KMP算法
KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。
算法重点:前缀表(prefix table)——>next数组
前后缀的概念:文章中字符串的前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。
后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。
前缀表中的元素:就是最长相同前后缀的长度(最长相同前后缀可以简单理解为对称的最大值)如下图:
如a,因为前后缀是不包括第一个/最后一个,所有最长相同前后缀是0
aa 最长相同前后缀都是a 所以是1
同理aabaa 是2
KMP算法基本思路
遍历两个字符串,一一比较,
当找到的不匹配的位置, 那么此时要看待查找到的字符串的前一个字符的前缀表的数值是多少,然后回退前缀表数值个位数,继续向下比较。不用再比较前面已经匹配过的字符。
pyhton实现
如例题,链接
实现 strStr() 函数。
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回 -1 。
构建next数组(前缀表)
前缀表是对要查找的字符串构建的
a=len(needle)
b=len(haystack)
def getnext