KMP算法
1.应用场景
1.1 介绍:
KMP 算法(Knuth-Morris-Pratt 算法)是一个著名的字符串匹配算法,效率很高,但是确实有点复杂。
1.2 应用:
在实际生活中,字符串查找是非常常见的,在一段信息中匹配到你需要寻找的信息(就是在一段字符串找到需要匹配的字符串),那么怎样去寻找呢?
1.2.1 与寻常的暴力匹配寻找,它有怎样的优化
我们运用暴力匹配的时候,每次都匹配了很多此无意义的字符,什么意思呢? 请看:
我们从这里开始匹配
因为主串【i】和匹配串【j】一直不相等,所以主串右移
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2FRshAuD-1600357474437)(en-resource://database/501:1)]
现在主串【i】和匹配串【j】相等开始匹配,i和j一起右移
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Du7rTIYl-1600357474439)(en-resource://database/503:2)]
现在它们又不相等了,所以
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V7pWwAsB-1600357474440)(en-resource://database/503:2)]
按照暴力匹配的算法思想: 此时应该将i回溯,将i回到原来开始的位置的下一个位置,j归零。代码中的表现就是 i-(j-1),j=0,但这样效率实在太差,我们已经知道关于字符串一部分信息了,我们怎样运用这部分加速匹配信息呢?这里就要用到
KMP算法了
2 算法思想介绍
算法简介
主要是消除了主串指针的回溯,之后效率就提高
加速匹配信息的介绍和提取
KMP 算法主要是通过消除主串指针的回溯来提高匹配的效率的,那么,它是则呢样来消除回溯的呢?就是因为它提取并运用了加速匹配的信息!
这种信息就是对于每模式串 t 的每个元素 t j,都存在一个实数 k ,使得模式串 t 开头的 k 个字符(t 0 t 1…t k-1)依次与 t j 前面的 k(t j-k t j-k+1…t j-1,这里第一个字符 t j-k 最多从 t 1 开始,所以 k < j)个字符相同。如果这样的 k 有多个,则取最大的一个。模式串 t 中每个位置 j 的字符都有这种信息,采用 next 数组表示,即 next[ j ]=MAX{ k }。
加速信息就是next数组
next数组
怎样优化
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KrNm9C2X-1600357474442)(en-resource://database/505:1)]<