kmp是很容易考的算法,我mentor说,什么时候才能找到一个会kmp的啊,可见kmp的重要性。
kmp实际就是对暴力的优化,使得指针回溯变少
先说暴力:以长字符串每个点为起点进行
public static boolean compareString(String s,String p){
if(s.length()<p.length())
return false;
int j=0;
for(int i=0;i<s.length();i++){
int p1=i;
while (p1<s.length()&&p1<p.length()&&s.charAt(p1)==s.charAt(j)){
p1++;
j++;
}
if(j==p.length())
return true;
else {
j=0;
}
}
return false;
}
再说就是kmp了
kmp的原理就是尽量复用字符串。
移动方式:长字符串的指针只后移,短字符串的在失去匹配后变为已匹配的前缀索引(next[j])
•多一个记录:该位置前面有多少相同的重复前缀
•失配时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值'
A和B不匹配没有可以复用的前缀,j=-1所以两个指针都右移
匹配一位i++ j++
失去匹配:看当前位有多少前缀,从表格看有2个那么j移到第3个位置(index=2)
再次失去匹配,j移动到第0个位置
j移动到-1位置,重新匹配
失去匹配,移动到第二个位置
匹配成功
public
存可以复用的前缀的next数组怎么求:
首先明确一个定义什么是前缀,什么是后缀
前缀就是除了最后一位之外的部分
后缀就是除了第一个之外的部分。
求法双指针,k是前缀指针j是后缀指针,匹配则k++不匹配则k回退直到k=-1进行下一个j匹配
回退方法k=next[k]看当前位是否有已匹配前缀。
public
优化一点(不看也没关系)
ABACABABC
ABAB
第一次失去匹配的是第二个b那么按照之前的会想左移动3-1=2位。
这时候B还是不和C匹配,所以还得移动,一个小的优化就是:
如果发现前面还是B那就移动到这个B的上一位
-1 0 0 1变成。 -1 0 -1 0这样子就可以减少移动次数(有一点点像并查集)
public
综上结束。