做到LeetCode第28题,看完题干就知道是考kmp算法,愣是想不起来kmp算法怎么写了,把四年前的知识还给老师了,复习了复习,码出来代码以后留着复习用。
原理:nexts数组是kmp算法核心,每一位的值用来代表前面有多少位是重复的,可以从这个值来继续判断(数组下标从0开始,例如前5为是重复的,则可以从下标为5继续判断,因为这是第6个元素),同时意思是,如果要匹配的字符某位和当前模板某位查找不匹配(失败)则意味着要回退到之前匹配过的位置,也就是可以从这个值开始继续遍历模板,之前的不用再看,因为前面的重复。
举个栗子:
模板字符为: ababcababe
则nexts数组为:-1001201234
如何求nexts数组:规定第一位为-1,第二位为0;从第三位开始,当前数据下标为index,nexts数组index-1位置的值为count,count即为i-1位置最长公共前缀,不包含当前为index-1。如果index-1位字符(上一位字符)和count位字符(最长公共前缀的下一个位字符) 相等,则表示上一位也重复,那么count++,记录在nexts[index]位。如果不一样,则取nexts[index-1