代码随想录第九天|28.实现strStr（）、459.重复的子字符串

最新推荐文章于 2024-10-04 20:45:38 发布

xiaoning__

最新推荐文章于 2024-10-04 20:45:38 发布

阅读量48

点赞数

文章标签：算法 c++ 数据结构

本文链接：https://blog.csdn.net/xiaoning__/article/details/131221644

版权

文章介绍了KMP算法的核心思想，即利用已匹配的信息避免从头匹配，详细阐述了前缀表（next数组）的构建过程，并提供了实现strStr()函数的代码示例。此外，还探讨了如何通过移动匹配法检查字符串是否由重复子串构成。

摘要由CSDN通过智能技术生成

KMP算法

主要思想：

当出现字符串不匹配时，可以知道一部分之前已经匹配的文本内容，可以利用这些信息避免从头再去做匹配。

前缀表（next数组）：

用来回退，记录模式串与主串不匹配时，模式串应从哪里开始重新匹配。记录下标i（包括i）的字符中，有多大长度的相同前后缀。

前缀：不包括最后一个字符的所有以第一个字符开头的连续子串。

后缀：不包含第一个字符的所有以最后一个字符结尾的连续子串。

构造next数组（整体-1）：

1）初始化：

定义两个指针，j指向前缀末尾，i指向后缀末尾。

next[i]为i（包括i）之前的最长相等前后缀长度。

int j = -1;
next[0] = j;

2）处理前后缀不相等的情况。

s[i]与s[j+1]不相等，需找到j在next数组里的值next[j]。

3）处理前后缀相等情况。

s[i]与s[j+1]相等，同时向后移动i和j，说明找到相同的前后缀，同时需要将j的长度赋值给next[i]。

void getNext(int* next, const string& s){
    int j = -1;
    next[0] = j;
    for(int i = 1; i < s.size(); i++) { // 注意i从1开始
        while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
            j = next[j]; // 向前回退
        }
        if (s[i] == s[j + 1]) { // 找到相同的前后缀
            j++;
        }
        next[i] = j; // 将j（前缀的长度）赋给next[i]
    }
}

得到next数组后，用其做匹配。

28.实现strStr（）

实现 strStr() 函数。

给定一个 haystack 字符串和一个 needle 字符串，在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在，则返回 -1。

class Solution {
public:
    void getNext(int* next,string& s) {
        int j=-1;
        next[0]=j;
        for(int i=1;i<s.size();i++) {
            while(j>=0&&s[i]!=s[j+1]) {
                j=next[j];
            } 
            if(s[i]==s[j+1]) {
                j++;
            }
            next[i]=j;
        }
    }
    int strStr(string haystack, string needle) {
        if(needle.size()==0) return 0;
        int next[needle.size()];
        getNext(next,needle);
        int j=-1;
        for(int i=0;i<haystack.size();i++) {
            while(j>=0&&haystack[i]!=needle[j+1]) {
                j=next[j];
            }
            if(haystack[i]==needle[j+1]) {
                j++;
            }
            if(j==(needle.size()-1)) {
                return (i-needle.size()+1);
            }
        }
        return -1;
    }
};

459.重复的字符串

给定一个非空的字符串，判断它是否可以由它的一个子串重复多次构成。给定的字符串只含有小写英文字母，并且长度不超过10000。

移动匹配法：

当一个字符串内部由重复的字符串组成，则字符串的结构一定是由前后相同的子串组成。

则可建立s+s构成新的字符串，后面的子串做前串，前面的子串做后串，还可构成一个s。

例如：

因此，只要s是由重复子串组成，拼接在一起则可找到s，但需除去s+s的开头与结尾。

class Solution {
public:
    bool repeatedSubstringPattern(string s) {
        string t=s+s;
        t.erase(t.begin());
        t.erase(t.end()-1);
        if(t.find(s)!=std::string::npos) return true;
        else return false; 

    }
};

（std::string::npos表示不存在的位置）