KMP算法简述
KMP算法中含有部分匹配表(Partial Match Table)的数组,这个数组是KMP的核心,因为在字符串匹配的过程中回退问题的解决就要依靠这个PMT。PMT是怎么来的呢?
PMT中的值是字符串的前缀集合与后缀集合的交集中最长元素的长度。例如,对于”aba”,它的前缀集合为{”a”, ”ab”},后缀 集合为{”ba”, ”a”}。两个集合的交集为{”a”},那么长度最长的元素就是字符串”a”了,长 度为1,所以对于”aba”而言,它在PMT表中对应的值就是1。再比如,对于字符串”ababa”,它的前缀集合为{”a”, ”ab”, ”aba”, ”abab”},它的后缀集合为{”baba”, ”aba”, ”ba”, ”a”}, 两个集合的交集为{”a”, ”aba”},其中最长的元素为”aba”,长度为3。
从上面可以简单看出是取前缀和后缀的交集得来的。为什么要这样呢?
如果在某个位置无法匹配的话,PMT系数帮助我们快速回退,避免被删档重开。在回退的过程中必须回退地尽可能少,例如
甲:abbaabbaaba
乙:abbaaba
在回退乙时为了尽可能少,我们需要找出已经和甲匹配的那一部分。
首先对于甲来说:需要倒着看。
对于乙来说:需要正着看。
这样才能找到匹配的那一部分。于是有了前缀和后缀这个说法。乙后退较少的步数就可以避免重复劳作,提高效率了。
题目描述
生成Pmt函数
这里是利用两个指针,同时也利用了next数组的特性进行回退,这里的回退不是全部的回退,而是根据next里面的数值进行回退。
回退详细说明
视频的up主是用的右移并加一的next数组。
public static int[] getPmt(String needle) {
int[] next = new int[needle.length()];
//定义好next数组
for (int right = 1, left = 0; right < needle.length(); right++) {
//定义好两个指针right与left
//在for循环中初始化指针right为1,left=0,开始计算next数组,right始终在left指针的后面
while (left > 0 && needle.charAt(left) != needle.charAt(right)) {
//如果不相等就让left指针回退,到0时就停止回退
left = next[left - 1];//进行回退操作;
}
if (needle.charAt(left) == needle.charAt(right)) {
left++;
}
next[right] = left;
}
return next;
}
在主程序中使用这个next数组进行回退,做法和生成next数组类似。区别是少了生成next数组的部分。
class Solution {
public int strStr(String haystack, String needle) {
int h = haystack.length(),n = needle.length();
if(n==0){
return 0;
}
//生成PMT
int[] next = getPmt(needle);
for (int i = 0,j=0; i <haystack.length() ; i++) {
while (j>0&&haystack.charAt(i)!=needle.charAt(j)){
j=next[j-1];
}
if (haystack.charAt(i)==needle.charAt(j)){
j++;
}
if (j==needle.length())
return i-needle.length()+1;
}
return -1;
}
public static int[] getPmt(String needle) {
int[] next = new int[needle.length()];
//定义好next数组
for(int left=0,right=1;right<needle.length();right++){
while(left>0&&needle.charAt(left)!=needle.charAt(right)){
left = next[left-1];
}
if(needle.charAt(left)==needle.charAt(right)){
left++;
}
next[right] = left;
}
return next;
}
}