前言
【例】:主串s:AAAABABABBBBB
模式串t :ABABABB
本文主要针对KMP算法的代码方式进行解析,首先我们要知道KMP算法的作用,是用来进行字符串匹配的,即在s串中找出与t串完全匹配的字符串,并且返回起始位置。
- 首先介绍字符串匹配的暴力匹配算法;
- 然后介绍有next数组的KMP匹配算法;
- 最后介绍next数组的求解算法;
这是因为以上三种算法在形式上有一定的相似之处,且思想是是由简单到困难的。
1. 暴力匹配算法
- 使用两个指针,一个指针i指向主串,一个指针j指向模式串。
- 从主串和模式串的第一位(下标为0)开始,同时移动指针i,j,并且对比字符串是否匹配,如果匹配,则同时移动,直到某一个指针越界(i<s.length() && j<t.length())。
- 如果不匹配,则i和j同时回退到原来的位置并前移一个位置后开始匹配。原来位置用k记录。
- 最后判断,j是否等于t.length()。若等于则存在返回i-j(或者k),否则匹配失败。
public static int index(String s, String t) {
int i=0,j=0,k=0;
while(i<s.length() && j<t.length()){
if(s.charAt(i)==t.charAt(j)){
i++;
j++;
}else{
i=++k;
j=0;
}
}
if (j==t.length()){
return i-j;
}else{
return 0;
}
}
2. KMP匹配算法
- 同样,使用两个指针,一个指针i指向主串,一个指针j指向模式串。
- 如果匹配成功则与暴力匹配算法相似:. 从主串和模式串的第一位(下标为0)开始,同时移动指针i,j,并且对比字符串是否匹配,如果匹配,则同时移动,直到某一个指针越界(i<s.length() && j<t.length())。
- 若匹配失败,需要根据next数组重置j的下标,再进行匹配。若失败,则循环此步骤。
KMP算法与next数组:
KMP算法主串上的指针i不需要移动,若匹配失败则只需要移动模式串上的指针j与主串上i的字符进行比较就可以。next数组中存储的该位置字符串是匹配失败后,j需要移动到的位置。且next数组保证了j位置前的子串与模式串匹配!
- 特殊情况,若移动到模式串的第一位仍然和主串不匹配。则i和j同时回退到原来的位置并前移一个位置后开始匹配。此时next数组中next[j]=0; 故,此时,i++;j++; 即可(因为)。
- 最后判断,j是否等于t.length()。若等于则存在返回i-j,否则匹配失败。
我们可以先写出暴力的解法,然后再改为KMP算法!
public static int kmpMatch(String s, String t){
int[] next = getNextArray(t);
int i = 0, j = 0;
while (i<s.length() && j<t.length()){
if(j == 0 || s.charAt(i)==t.charAt(j)){ //此处与暴力解法不同
i++;
j++;
}
else
j = next[j]; //此处与暴力解法不同
}
if(j == t.length())
return i-j;
else
return 0;
}
3. next数组求解算法
- next数组求解算法只针对模式串,其代码相似度与KMP算法很像,因为其内部也使用了KMP算法的思想!
- 若t.charAt(i)==t.charAt(j),则next[i+1]=j+1;
- 若t.charAt(i)!=t.charAt(j),则使用KMP算法,直到匹配,则使用步骤2;
- 特殊情况,若移动到模式串的第一位仍然和主串不匹配,此时j==0。则 next[i+1]=1; 所以写在一起就可以;
- 最后返回的是next数组。
public static int[] getNextArray(String t) { int[] next = new int[t.length()+1]; int i=1,j=0; //这里的j存储的是next数组内的值,即t中的下标 next[1]=0; while(i<t.length()){ if(j==0||t.charAt(i)==t.charAt(j)){ next[i+1]=j+1; //此处与KMP算法不同 i++; j++; }else{ j=next[j]; } } return next; //此处与KMP算法不同 }