代码随想录算法训练营第九天 | 28. 实现 strStr()、459. 重复的子字符串、字符串总结、双指针复习

28. 实现 strStr()

题目链接:LeetCode28. 找出字符串中第一个匹配项的下标

文章讲解:代码随想录—28. 实现 strStr()

KMP算法:

KMP主要应用在字符串匹配上,当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配

至于回退到什么位置,就需要建立前缀表查看回退的下标,这个前缀表我们这里叫做 next 数组。前缀表:记录下标 i 之前 (包括 i ) 的字符串中,有多大长度的相同前缀后缀

前缀:不包含最后一个字符的所有以第一个字符开头的连续子串。后缀:不包含第一个字符的所有以最后一个字符结尾的连续子串。

构建前缀表的思路:1. 初始化 2. 处理前后缀不相等的情况 3. 处理前后缀相等的情况

具体思路可以详看代码随想录关于kmp的两个视频,讲解很清晰。

class Solution {
public:
    void getNext(int* next, string s) {
        int j = 0;
        next[0] = 0;
        for (int i = 1; i < s.size() - 1; i ++) {
            while (j > 0 && s[i] != s[j]) j = next[j - 1];
            if (s[i] == s[j]) j ++;
            next[i] = j;
        }
    }

    int strStr(string haystack, string needle) {
        if (needle.size() == 0) return 0;
        int next[needle.size()];
        getNext(next, needle);
        int j = 0;
        for (int i = 0; i < haystack.size() - 1; i ++) {
            while (j > 0 && haystack[i] != needle[j]) j = next[j - 1];
            if (haystack[i] == needle[j]) j ++;
            if (j == needle.size()) return (i - j + 1);
        }
        return -1;
    }
};

时间复杂度:O(m + n)

空间复杂度:O(n)

459. 重复的子字符串

题目链接:LeetCode459. 重复的子字符串

文章讲解:代码随想录—459. 重复的子字符串

思路:

暴力解法太麻烦了,就不阐述了。文章中介绍了两种解法,移动匹配和kmp,都运用了一些数学思维。

移动匹配

如果一个字符串由许多重复单元组成 ,那么把两个该字符串拼在一起,一定能在中间找到该字符串。在寻找时要把首位字符串删除,因为要保证搜出来的是中间拼接而成的字符串。

class Solution {
public:
    bool repeatedSubstringPattern(string s) {
        string t = s + s;
        t.erase(t.begin());
        t.erase(t.end() - 1);
        if (t.find(s) != std::string::npos) return true;
        return false;
    }
};

时间复杂度:O(n)

空间复杂度:O(1)

问题:这里的 find 函数为什么不能用 t.find(s) != t.end() 判断?

string中的find函数的返回值是寻找的值的下标,其他的例如vector,find函数返回的是对应元素的迭代器 

KMP算法

利用一点点数学思想可以从下图知道,如果该字符串存在重复单元,那字符串减去最长相等前缀(或后缀)剩下的部分就是最小重复单元。那么如果能验证字符串长度是最小重复单元长度的整数倍,就能证明该字符串是存在重复子字符串的了。

class Solution {
public:
    void getNext(int* next, string s) {
        int j = 0;
        next[0] = 0;
        for (int i = 1; i < s.size(); i ++) {
            while (j > 0 && s[i] != s[j]) j = next[j - 1];
            if (s[i] == s[j]) j ++;
            next[i] = j;
        }
    }

    bool repeatedSubstringPattern(string s) {
        int next[s.size()];
        getNext(next, s);
        int len = s.size();
        if (next[len - 1] != 0 && len % (len - next[len - 1]) == 0) return true;
        return false;
    }
};

时间复杂度:O(n)

空间复杂度:O(n)

字符串总结

  • 在C语言中,把一个字符串存入一个数组时,也把结束符 '\0'存入数组,并以此作为该字符串是否结束的标志
  • vector< char > 和 string 有什么区别:在基本操作上没有区别,但是 string提供更多的字符串处理的相关接口,例如string 重载了+,而vector却没有。
  • 主要解题思路:双指针、先局部翻转再整体翻转、KMP

双指针复习

  • 用两个指针解决双层 for 循环问题

  • 很多数组填充类的问题,都可以先预先给数组扩容,然后在从后向前进行操作,如第八天的替换空格一题

  • 代替在 for 循环下使用 erase 问题

  • 三数之和、四数之和经常练一下

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值