关于字符串查找匹配算法kmp,进行一下个人总结,希望也能帮到大家;
举个例子:
主串: “aaababaaccddee”
模式串:“ababaa”
在主串中查找模式串是否存在,如果存在位置,出现在主串的那个位置
模式串,通过前后缀相同字符串构建next数组或者构建nextval数组;
当模式串在主串中进行匹配时候,当模式串与主串不匹配时,模式串根据next或则nextval数组进行有效回退,减少无意义的重头回退和重头匹配
加快了查找速度
模式串可以构建2种跳转数组,一种是next数组,另一种是nextval数组;
nextval数组是next数组的增强版本,效率更高,减少了不必要的回退机制;
原因是 nextval数组将next数组里面的相同累加出现的值进行了合并
简单例子:
序号 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
字符串 | a | a | a | a | a | a | a | b |
next数组 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
nextval数组 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 7 |
当主串与模式串在第6个位置不匹配时候,next数组会回退到5位置,再回退到4,3,2,1,0;next回退了6次,其实此时从第0到第6位置
都是字符a,此时的next回退效率会很慢的
nextval数组将回退机制进行优化关联,不是基于next数组记录前后缀字符个数的加一方式,而是不断的对next的上一个元素位置进行反推
实际在我看到一些资料中,很多介绍的讲解,直接就讲nextval的实现形式,没有讲解next的方式,就会导致一些知识体系上的空缺
kmp算法的组成知识:
1.模式串根据前后缀长度,构建next 或 nextval数组
2.模式串与主串进行字符匹配,当不匹配时,模式串根据next或nextval进行回退,主串位置不变,继续进行匹配