题目
Implement strStr().
Returns the index of the first occurrence of needle in haystack, or -1 if needle is not part of haystack.
思路
该问题是典型的字符串匹配问题.
在普通的字符串匹配算法中,当遇到主串与模式串的当前字符不匹配时,直觉应该是把主串指针右移单个字符,再逐个比较;但此时我们已经知道主串在当前指针前的若干个字符
例如假设主串为BBC ABCDAB ABCDABCDABDE
,模式串为ABCDABD
当空格与字符D
不匹配时,我们其实已经知道前面六个字符为ABCDAB
KMP算法的主要思想就是利用这些已知的信息,快速定位到下个要比较的位置. 首先学习下前后缀的概念
假设主串为str,模式串为p,当str[i]与p[j]不相同时,在普通算法中,我们需要把主串指针右移,其实此时我们比较的是p[0~j-1]字符串的前后缀,如果已知字符串前后缀的最长公共长度为k,我们可以直接把模式串向右移动距离k(其实等价于将指针j移动到位置k,因为下标从零开始);换句话说,当str[i]与p[j]不相同时,我们把指针j移动到位置next[j]
我们把模式串的该信息保存在数组next中,next[j]表示字符串p[0~j-1]前后缀的最长公共长度. 下面介绍怎么求该数组
next[0] = -1;
next[1] = 0;//只能移动到该位置
假如已知next[0] … next[j],现在要求next[j+1]
- 如果next[j] = k,p[j] = p[k] , 推导出next[j+1] = k++;
- 否则我们可以对长度为k的字符串再进行分割,即k = next[k],在比较p[k] 与 p[j]的大小
据此我们可以写成求next数组的代码
public int[] getNext(String str){
char[] arr = str.toCharArray();
int[] next = new int[arr.length];
next[0] = -1;
int j = 0, k = -1;
while(j < arr.length-1){
if(k==-1 || arr[j]==arr[k]){
next[++j] = ++k;
}else{
k = next[k];
}
}
return next;
}
KMP算法的代码
public int strStr(String haystack, String needle) {
if(needle.length()==0) return 0;
if(haystack.length()==0) return -1;
char[] str = haystack.toCharArray();
char[] p = needle.toCharArray();
int[] next = this.getNext(needle);
int i=0, j=0;
while(i<str.length && j<p.length){
if(j==-1 || str[i]==p[j]){
i++;//当str[i] != p[0]
j++;
}else{
j = next[j];
}
}
if(j == p.length) return i-j;
else return -1;
}