如果没了解过KMP,我也不详细介绍了,本篇目的在于写下来,了解的更彻底。
首先kmp是解决 查询字符串2 在字符串1中的位置的算法!String.indexOf()并不使用kmp,因为kmp需要额外的空间,在数据量小的情况下,并不划算。
kmp首先是有一个跳跃的概念,正常暴力解法就是双循环遍历,但是这期间有很多无效的遍历,肯定是不匹配的,举个例子:字符串1 abcabce 字符串2 abcabcf 自增i和自增j 遍历到e和f不相等,暴力解法是将i++,j=0一直遍历到 i=3 j=0 再次相等,i=1,2都是无效的遍历,
kmp就是帮助你跳过这些不需要匹配的遍历!
既然需要跳跃,就需要先知道跳跃的步数!将每一个字段包含的最长子串存在一个next[]中,最长子串有两个概念,字符串的前缀和后缀,举几个例子:aab b之前最长子串长度就是1
abcabce e之前最长子串是3 。细心观察,哈哈!也要先说明一下 字符串的前缀和后缀的概念。
前缀:abc 前缀就是从前往后 算是前缀 比如 a ab abc都是 abc的前缀
后缀:abc 后缀就是从后往前 算是后缀 比如 a ab abc都是 abc的前缀
理解了前缀后缀,最长前缀的概念,咱们在思考一个问题,比如e的最长前缀如何快速获得呢!
首先:运用动态规划的思想,e的最长前缀和e之前的c的最长前缀是有关系的!c的最长前缀假如已知,是ab,即2,当求e的最长前缀时,我们就不需要比较ab ab这两个了,直接看 前缀的下一位str[2]位置的c和e之前的一位str[5],这个c,两个字符是否相等,如果相等,就是直接是c的最长前缀加1!
第二种情况:当上面的不成立,str[2] 和str[5] 这两个位置的字符不相等,我们就需要比较str[5]和 next[2]的位置的字符是否相等,原因:5和2不相等的情况下,我们就需要求2位置的最长前缀是多少,然后比较2位置最长前缀的下一位是否和5相等,如果相等,e的最长前缀就是2位置的最长前缀+1,一次类推,也是跳跃,因为我们是在求最长前缀和最长后缀的匹配,即使5和2之前的一位相等,也不能说明 最长前置和最长后缀是匹配的,因为可能两个字符的长度不同!我们是在保证前一个字符拥有最长前缀的基础上,看下一位是否相同,相同+1,进行的处理,每一次都要保证这个前提!,如果k=0,next[k]就等于-1,这时候next[6] = 0;默认next[0]=-1,next[1]=0,这也是动态规划中,知道前两个数字结果!
所以遍历一个字符串str求 他的每个字符的最长前缀时,这里是关键!下面的kmp比较简单了
直接遍历比较,不相等时,字符串1 的 i 回退next[j]的位置,j回到0即可,若next[j] = 0或者-1,i++
public void getNext(int[]next,String str){
next[0] = -1;
int k = 0;
int index= 0;
while(index < str.length()-1){
if(k==-1 || str.charAt(k) == str.charAt(index)){
next[++index] = ++k;
}else{
k = next[k];
}
}
}
public int kmp (String S, String T) {
// write code here
if(S == null || S=="" || T ==null || T ==""){
return 0;
}
int[] next = new int[S.length()];
getNext(next,S);
int i = 0,j=0;
while(j< T.length()){
if(S.charAt(i) == T.charAt(j)){
i++;j++;
}else if(next[i] ==-1) {
j++;
}else {
i=next[i];
}
}
}
// 1 .给定一个字符串 如何加最短的字符(只能在原始串的后面进行添加)使其构成一个长的字符串且包含两个原始字符串~
// 思路:其实就是最大前后缀长度数组~ e.g. abcabc ---->abcabcabc 最少增加3个
思考下写下代码~