算法训练营 day9 字符串 KMP 实现strStr() 重复的子字符串
KMP
KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。
实现strStr()
28. 找出字符串中第一个匹配项的下标 - 力扣(LeetCode)
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
class Solution {
public int strStr(String haystack, String needle) {
int[] next = new int[needle.length()];
getNext(next,needle);
int j=0;
for (int i = 0; i < haystack.length(); i++) {
while (j>0&&haystack.charAt(i)!=needle.charAt(j)){
j=next[j-1];
}
if (haystack.charAt(i)==needle.charAt(j)){
j++;
}
if (j==needle.length()){
return i-needle.length()+1;
}
}
return -1;
}
public void getNext(int[] next, String s) {
int j = 0;
next[0]=0;
char[] ch = s.toCharArray();
for (int i = 1; i < s.length(); i++) {
while (j>0&&ch[j]!=ch[i]){
j=next[j-1];
}
if (ch[j]==ch[i]){
j++;
}
next[i]=j;
}
}
}
重复的子字符串
给定一个非空的字符串 s
,检查是否可以通过由它的一个子串重复多次构成。
移动匹配
当一个字符串s:abcabc,内部由重复的子串组成,那么这个字符串的结构一定是这样的:
也就是由前后相同的子串组成。
那么既然前面有相同的子串,后面有相同的子串,用 s + s,这样组成的字符串中,后面的子串做前串,前后的子串做后串,就一定还能组成一个s,如图:
所以判断字符串s是否由重复子串组成,只要两个s拼接在一起,里面还出现一个s的话,就说明是由重复子串组成。
当然,我们在判断 s + s 拼接的字符串里是否出现一个s的的时候,要刨除 s + s 的首字符和尾字符,这样避免在s+s中搜索出原来的s,我们要搜索的是中间拼接出来的s。
class Solution {
public boolean repeatedSubstringPattern(String s) {
StringBuilder sb = new StringBuilder();
sb.append(s+s);//拼接字符串s
sb.deleteCharAt(0);//掐头
sb.deleteCharAt(sb.length()-1);//去尾
if (sb.indexOf(s)>=0) return true;
return false;
}
}
KMP
class Solution {
public boolean repeatedSubstringPattern(String s) {
int len = s.length();
int[] next = new int[s.length()];
getNext(next,s);
if (next[len-1]>0&&len%(len-next[len-1])==0){
return true;
}
return false;
}
public static void getNext(int[] next,String s) {
int j = 0;
next[0]=0;
for (int i = 1; i < s.length(); i++) {
while (j>0&&s.charAt(i)!=s.charAt(j)){
j=next[j-1];
}
if (s.charAt(j)==s.charAt(i)){
j++;
}
next[i]=j;
}
}
}