KMP算法的原理

本文深入解析KMP算法,包括如何理解和应用前缀后缀概念,以及next数组的构造过程。通过实例演示计算next数组,并阐述模式串移动位数的策略。重点在于理解最长公共子串和next数组的作用,适用于查找字符串中的模式匹配问题。
摘要由CSDN通过智能技术生成

kmp算法就是在主串里面快速地寻找出模式串的位置,之前的BF算法太过暴力以及会牵扯到回溯的问题大大浪费了已经匹配好的串。
先来认清理解前缀后缀以及最长公共子缀
例如串:ababca
它的前缀:a,ab,aba,abab,ababc
后缀:babca,abca,bca,ca,a
最长公共子缀就是a

例如串:abbaa
前缀:a,ab,abb,abba
后缀:bbaa,baa,aa,a
最长公共子缀就是a

例如串:abaab
前缀:a,ab,aba,abaa
后缀:baab,aab,ab,b
最长公共子缀ab

ok,然后来理解next数组吧,我还是直接告诉大家咋样算,那个发明kmp的研究生很厉害

next数组一般有三种情况:
j=1的时候 0
有公共子缀: 最长公共子缀长度+1
无公共子缀 :1

比如串:
1 2 3 4 5 6 7 8
a b a a b c a c
next[j]: 0 1 1 2 2 3 1 2

注意这里求的子串的值在[1,j-1]
就是比如next[4]其实是看[1,3]也就是aba,它的最长公共子缀是a,所以符合有公共子缀的情况,所以next[4]=a的长度也就是1再+1=2
如果你看不懂我就明讲一下:

next[1] j=1所以符合第一种情况j=1 所以为:0
next[2] a无公共子缀 符合第三种情况 所以为:1
next[3] ab无公共子缀符合第三种情况 所以为:1
next[4] aba它的最长公共子缀是a符合第二种情况 所以为2
…后面都一样

然后来说每次模式串移动的位数:
分为两种情况:
有匹配字符的时候
移动位数=已经匹配的串的长度-最后一个匹配字符的next数组的值
无匹配字符:
移动位数=1

这个是我验证过的,应该是没有问题的,我这篇也是我自己的笔记吧,只讲了kmp的原理以及next数组求法和模式串移动位数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值