代码随想录 字符串part02|28.实现strStr、459.重复的子字符串
28. 实现 strStr()
思路
:
因为KMP算法很难,大家别奢求 一次就把kmp全理解了,大家刚学KMP一定会有各种各样的疑问,先留着,别期望立刻啃明白,第一遍了解大概思路,二刷的时候,再看KMP会 好懂很多。
KMP算法要实现的就是,在一个字符串中判断另一个子串有没有在其中出现过。
KMP算法的理论基础:
- 解决字符串匹配问题:字符串匹配最先是暴力解法O(m*n)
- KMP算法如何找上述的‘b’?前缀表!
找字符串的最长相等前后缀,上述‘aabaa’的最长相等前后缀的长度为2,会跳到下标为2的地方 - 前缀与后缀
前缀是包含首字母,不包含尾字母的所有子串,a aa aab aaba aabaa是前缀
后缀是包含尾字母,不包含首字母的所有子串,f af aaf baaf abaaf 是后缀 - 最长相等前后缀
最长相等前缀和后缀的长度 a:0; aa:1; aab:0; aaba:1; aabaa:2; aabaaf:0
得到前缀表序列:0 1 0 1 2 0 - 使用前缀表的匹配过程
上例中,f为不匹配的字符,最长相等前后缀为2,找下标为2 的地方继续匹配 - next数组
next数组或prefix数组,存放前缀表
前缀表序列:0 1 0 1 2 0 (找冲突的前一位数字对应下标的值)
前缀表统一减一:-1 0 -1 0 -1 (找冲突的前一位再加一下标对应的值)
前缀表统一右移:-1 0 1 0 1 2 (找冲突的这一位下边对应的值)
【核心】遇见冲突的回退到上一次的位置
KMP算法的代码实现:
求前缀表的具体代码:
模式串:aabaaf
前缀表:0 1 0 1 2 0
四步:
- next数组初始化
j指向前缀末尾,初始化为0
i指向后缀末尾, - 处理前后缀不相同的情况
遇见冲突看前一位 - 处理前后缀相同的情况
- 更新next数组的值
伪代码(C++):
void getNext(next, s){
j=0;
next[0] = 0;
for(i=1;i<s.size();i++){
while(j>0 && s[i] != s[j]){ // 注意这里是while,不是if
j = next[j-1];}
if(s[i] == s[j]){
j++;
next[i] = j;}
}
}
python代码
:
待实现
459.重复的子字符串
思路
:
-
暴力解法
for 获取子串的结束位置
for 子串与主串比较
时间复杂度 O(n2) -
移动匹配
假设重复子串s:abcabc【前半部分和后半部分相等】
因此使用方法:判断s+s(去掉第一个字母和最后一个字母)中是否可以找到s
即ss.erase(首,尾).find(s) -
KMP解法
最小重复子串 就是 最长相等前后缀不包含的那部分
abababab 最长相等前缀 与 最长相等后缀 相等 的那个 前缀(后缀)长度是2:ababab 不包含的那部分 ab 就是最小重复子串
abababab前缀表:
00123456
if len%(len-next[size-1]) == 0:
return true
python代码
:
自己写的
class Solution:
def reverseStr(self, s: str, k: int) -> str:
for i in range(0,len(s),2*k):
if i+2*k > len(s):
end = len(s)
else:
end = i + 2*k
temp = s[i:end]
temp1 = temp[:k][::-1] + temp[k:]
s = s[:i]+temp1+s[end:]
return s
字符串总结
思路
:
python代码
:
class Solution:
def change(self, s):
lst = list(s) # Python里面的string也是不可改的,所以也是需要额外空间的。空间复杂度:O(n)。
for i in range(len(lst)):
if lst[i].isdigit():
lst[i] = "number"
return ''.join(lst)