今日任务
- 28. 实现 strStr()
- 459.重复的子字符串
KMP算法
KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了。
经典题型是求在文本串里是否出现过模式串
所以如何记录已经匹配的文本内容,是KMP的重点,也是next数组肩负的重任。
前缀表(next数组) 最长公共(相等)前后缀
前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配
什么是前缀表:记录下标i之前(包括i)的字符串中,有多大长度的相同前缀后缀。
在求next数组过程中,实现方式:①整体右移,初始位置设成-1②整体减一③原封不动的前缀表
LeetCode28 实现strStr()
题目链接:28. 实现strStr()
思路:
如何判断在文本串s里出现了模式串t呢,如果j指向了模式串t的末尾,那么就说明模式串t完全匹配文本串s里的某个子串了。
本题要在文本串字符串中找出模式串出现的第一个位置 (从0开始),所以返回当前在文本串匹配模式串的位置i 减去 模式串的长度,就是文本串字符串中出现模式串的第一个位置。
具体理解比较复杂,可以看代码随想录 (programmercarl.com),代码:
class Solution {
public int strStr(String haystack, String needle) {
if(needle.length()==0){
return 0;
}
int j = -1;
int[] next = new int[needle.length()];
getNext(next,needle);
//i从0开始
for(int i = 0;i<haystack.length();i++){
while(j>=0 && haystack.charAt(i)!= needle.charAt(j+1)){
j = next[j];
}
if(haystack.charAt(i) == needle.charAt(j+1)){
j++;
}
if(j == needle.length()-1){
return i-j;
}
}
return -1;
}
public void getNext(int[] next,String needle){
int j = -1;
next[0] = -1;
//i从1开始
for(int i =1;i<needle.length();i++){
while(j>=0 && needle.charAt(i) != needle.charAt(j+1)){
j = next[j];
}
if(needle.charAt(i) == needle.charAt(j+1)){
j++;
}
next[i] = j;
}
}
}
LeetCode459 重复的子字符串
题目链接:459. 重复的子字符串
KMP:
思路:如果字符串是由重复子串组成的,那么他的最小重复单位就是他的最长相等前后缀不包含的那个子串
对于abababab,其对应next数组是[0,0,1,2,3,4,5,6],
- 如果 next[len - 1] != -1,则说明字符串有最长相同的前后缀
- 最长相等前后缀的长度为next[len - 1]+1(如果以统一减一的前缀表作为next数组)
- 如果len % (len - (next[len - 1] + 1)) == 0 ,则说明数组的长度正好可以被 (数组长度-最长相等前后缀的长度) 整除 ,说明该字符串有重复的子字符串。
class Solution {
public boolean repeatedSubstringPattern(String s) {
int len = s.length();
int[] next = new int[len];
getNext(next,s);
int j = -1;
if(next[len-1]!=-1 && len%(len-(next[len-1]+1)) == 0){
return true;
}
return false;
}
public void getNext(int[] next,String s){
int j = -1;
next[0] = -1;
//i从1开始
for(int i =1;i<s.length();i++){
while(j>=0 && s.charAt(i) != s.charAt(j+1)){
j = next[j];
}
if(s.charAt(i) == s.charAt(j+1)){
j++;
}
next[i] = j;
}
}
}