学习目标:
ps:本文中的图片和标红加粗的文字,请一定不要错过,应为那是精华!
掌握 KMP 算法
学习内容:
学习步骤:
1、 KMP 算法干嘛的。
2、 为什么需要 KMP?
3、 next 数组的推导
4、 next 数组如何使用?
学习步骤:
1. KMP 算法干嘛的?
不多BB, 一句话就能概括了,用来在目标字符串中查找指定字串的。
2. 为什么需要 KMP?
这就要说到暴力求解的方式了,下面看一张图
像上面这种情况,暴力破解的话就时间复杂度就很高了。因为暴力破解的意思是,这里假如 i是控制S数组的,j是控制T数组的,当S[i]==T[j]时 ,肯定就是i++,j++,当 j == T.size()时,就找到了字串,当S[i] != T[j]时,j=0,i=i-j,然后在循环,回溯次数过多,这样时间复杂度就很高。
3. next 数组的推导
而KMP就是来解决这个问题的,主要是靠next数组来解决,所以下面来讲一下next数组的生成方式。
我们首先要了解一下前缀后缀这个概念。
假设现在我们有一个字符串:
CSDN
j(下标) | 1 2 3 4 |
---|---|
字符串 | C S D N |
前缀 | C,CS,CSD |
后缀 | SDN,DN,N |
好,现在了解了前缀后缀,我们在来讲next数组的生成过程,
首先看一张结果图:T_next[0] 可以不用考虑(这个直接不用看),也可赋值-1或者0。
T_next 数组就是T数组就是生成的next数组(里面对应的位置存放的是最大前后缀的长度 +1(当j>0时,j是next数组的下标)),这里我们就挑一个来讲一下,就挑T_next[5] 是怎么来的,首先取出index=5之前的所有字符(T[1]~T[4]),bbsb求最大前后缀
j(下标) | 1 2 3 4 |
---|---|
字符串 | b b s b |
前缀 | b,bb,bbs |
后缀 | bsb,sb,b |
可以发现,b 是最大前后缀,长度为1,但这不是最终值,记住 要 加 1,这样最后得到 T_next[5] = 1+1 = 2;
总结一下: 这里说从1开始是因为从1开始T_next[1]以后才是我们用到的数据,程序里执行不到next[0]4、 next 数组如何使用?
这里还是看图,只有图才能解释,相信文字都不喜欢看。
代码产出:
好的到了这儿,就基本成功了,原理解释清楚了,代码不久信手拈来了。下面贴一下愚笨的我的实现方式。
1.next数组代码
public class kmp {
//next数组
private int [] next;
private void get_next(String[] T) {
int i = 1;
int j = 0;
int length = Integer.parseInt(T[0]);
next = new int[length+1];
next[1] = 0;
while(i<length) {
if(j == 0 || T[i]==T[j]) {
i++;
j++;
next[i] = j;
}else {
j = next[j];
}
}
//打印next数组结果
for(Integer n:next)
System.out.print(n+" ");
System.out.println();
}
/**
* @param s 主串
* @param T 字串
* @param pos 从哪个位置开始匹配
* @return 返回匹配的第一个元素下标
*/
public int index_KMP(String[] s,String[] T,int pos) {
int i = pos;
int j = 1;
get_next(T);
int s_length =Integer.parseInt(s[0]);
int t_length =Integer.parseInt(T[0]);
while(i<=s_length&&j<=t_length) {
if(j == 0 || s[i] == T[j]) {
i++;
j++;
}else {
j = next[j];
}
}
if(j>t_length) {
return i-t_length;
}else
return 0;
}
}
调用代码
public static void main(String []args) {
kmp k = new kmp();
//s t 数组 0位置存放的元素的个数
String []s = new String[] {"12","b","b","s","b","b","s","b","b","s","b","b","c"};
String[] t = new String[] {"6","b","b","s","b","b","c"};
int index = k.index_KMP(s,t,1);
System.out.println(index);
}
PS:纯属个人理解,希望指正!