代码随想录训练营Day9 字符串part02 ●28. 实现 strStr()●459.重复的子字符串●字符串总结 ●双指针回顾

28. 实现 strStr()

题目链接:力扣题目链接

文章链接:代码随想录 (programmercarl.com)

视频链接1:​​​​​​帮你把KMP算法学个通透!B站(理论篇)

视频链接2:帮你把KMP算法学个通透!(求next数组代码篇)

这道题,我的第一想法就是两层遍历,暴力解法,但是时间复杂度较高,因为每一次匹配到不一样的元素,指向needle的指针都需要从头开始遍历,较为繁琐。

通过学习,知道了这道题还可以使用KMP算法来解决。

首先,我们需要知道什么是KMP算法,它与暴力的两层循环遍历有什么区别。

KMP算法简单的来说就是两个指针分别指向haystack和needle,依次循环遍历,如果不相等,指向needle的指针不会从头开始,而是指向一个固定的下标。这样就能减少部分遍历所花费的时间,而如何指向一个固定的下标,就需要用到前缀表next。

 前缀表里的元素,是以指针指向的元素为结尾所形成的子串中,最大前后缀相同子串的元素个数。比如指针指向下标4,字串为aabaa

它的前缀有a,aa,aab,aaba(前缀必须包含最前面的一个元素,这里是a,一定没有最后的元素)

       后缀有a,aa,baa,abaa(后缀必须包含最后面的元素,这里是a,一定没有最前面的元素)

最大前后缀相同的子串是aa,所以next[4]=2;

我们可以发现一个非常神奇同时非常重要的性质,任意一个字符串假定它的最大前后缀相同子串个数为n,那么这个子串从0到n-1所形成的子串和最后一个元素与它之前n-1个元素所形成子串是相等的!!!

比如子串abababab,最大前后缀相同子串个数为4,最前面4个数为abab,最后面四个数也是abab

这个性质是我们了解KMP算法的关键点!

例如:(借用知乎用户“海纳”的图)

当i与j处不匹配时,同时也说明了i-1处与j-1处是匹配的,通过知道j-1处的最大前后缀相同子串个数n,从而知道i-n到i-1所形成的子串与j-n到j-1所形成的子串相等,又因为刚刚所讲性质,j-n到j-1处所形成的子串与0到n-1处所形成的子串相等,所以j又可以移动到next(j-1)处,然后i与j继续匹配重复上述操作。(重点!!!)

那剩下的问题就是如何通过一个字符串写出它的前缀表(next数组)呢?

求next数组的过程完全也可以看成字符串匹配的过程,将两个相同的needle字符串错开一位进行匹配,一旦字符串匹配成功,那么当前的next值就是匹配成功的字符串的长度。

如图:(借用知乎用户(海纳)的图)

代码如下:

void getnext(int* next,string s)
    {
        int j=0;
        next[0]=0;
        for(int i=1;i<s.size();i++)
        {
            while(j>0&&s[j]!=s[i])
            {
                j=next[j-1];
            }
            if(s[j]==s[i])
            {
                j++;
            }
            next[i]=j;
        }
    }

总代码如下:

class Solution {
public:
    void getnext(int* next,string s)//将建立前缀表的过程也看成两个相同的字符串错位匹配的过程
    {
        int j=0;
        next[0]=0;
        for(int i=1;i<s.size();i++)
        {
            while(j>0&&s[j]!=s[i])
            {
                j=next[j-1];
            }
            if(s[j]==s[i])
            {
                j++;
            }
            next[i]=j;
        }
    }
    int strStr(string haystack, string needle) {
        int next[needle.size()];
        getnext(next,needle);//建立前缀表
        int j=0;
        for(int i=0;i<haystack.size();i++)
        {
            while(j>0&&haystack[i]!=needle[j])
            {
                j=next[j-1];
            }
            if(haystack[i]==needle[j])
            {
                j++;
            }
            if(j==needle.size())//如果j指向needle的最后一个元素'\0'了,说明前面全部匹配,直接返回起点坐标
            {
                return i-needle.size()+1;
            }
        }
        return -1;
    }
};

这道题就花了我5.5小时,纯纯大怨种。

459.重复的子字符串(KMP算法的运用)

 题目链接:力扣题目链接

文章链接:代码随想录 (programmercarl.com)

视频链接1:字符串这么玩,可有点难度! | LeetCode:459.重复的子字符串

 KMP算法使用条件:在一个串中查找是否出现过另一个串,所以这道题找能构成字符串的子串也可以使用KMP算法。

(借用一下卡哥的图)

由图可得:t[0]=k[0],t[1]=k[1],

                 又因为k[0]=t[2],k[1]=t[3],

                 所以t[0]=t[2],t[1]=t[3],

                 所以t[0]t[1]=t[2]t[3]。

所以当一个字符串由重复子串组成的,最长相等前后缀不包含的子串就是最小重复子串。

代码如下:

class Solution {
public:
    void getnext(string s,int* next)
        {
            int j=0;
            next[0]=0;
            for(int i=1;i<s.size();i++)
            {
                while(j>0&&s[j]!=s[i])
                {
                    j=next[j-1];
                }
                if(s[j]==s[i])
                {
                    j++;
                }
                next[i]=j;
            }
        }
    bool repeatedSubstringPattern(string s) {
        int len=s.size();
        int next[len];
        getnext(s,next);
        if (next[len - 1] != 0 && len % (len - (next[len - 1] )) == 0)//只要总长能整除剩余子串长度,则代表有最小重复子串
        {
            return true;
        }
        return false;
    }
};

字符串总结 

文章链接:代码随想录 (programmercarl.com)

双指针法

文章链接:代码随想录 (programmercarl.com)

一刷KMP算法,较难理解,花了一个下午5个多小时软磨硬泡总算有个一知半解,再接再厉!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值