关于模式串向右移动的位数为:j - next[j]的思考
1.有没有可能跳的太多了?
证明:
一方面证明只有跳相同前后缀长度才有可能匹配
证:
∵P[0,x]≠P[y,i] (否则的话为相同前后缀)=T[a,b]
∴不可能匹配
另一方面有最长相同前后缀长度保证不会跳多
易证
2.跳跃的本质:排除不可能匹配的情况
关于如何计算next数组的几个疑惑与思考
1.若P[i]=P[k],为什么next[i+1]=next[i]+1不可能更大了
即证明next[i+1]≤next[i]+1
证明:反证法若next[i+1]>next[i]+1,可证明next[i]并非最大
2.若P[i]≠P[k],希望找到次长相同前后缀为什么k=next[k]
证明:
∵next[i+1]≤next[i]+1且当P[i]≠P[k]时严格小于
∴所有的相同前后缀都有[0,x] [y,i] (长度小于k)的形式
设次长前后缀为[0,x] [y,i]
∵[0,x]=[y,i]=[z,k]
∴找[0,i]的次长前后缀等价于找[0,k]的最长前后缀
3.计算next[i+1] ([0,i]最长相同前后缀)的过程本质就是找[0,i-1]最长/次长/次次长/…长相同前后缀,然后判断[k]是否等于[i]取舍
证明:
若要[0,k]=[i-k,i],则一定要求有[0,k-1]=[i-k,i-1]
KMP时间复杂度分析
KMP算法的一次比较只会产生两种结果,一种就是匹配成功主串的指针向前移动,一种是匹配失败模式串整体向前移动,两者都移动完时算法必然结束。前面的移动必为m次,后面的移动最多m次。所以最大的时间复杂度为2m,差异只存在于模式串移动的幅度