KMP算法，力扣28题_kmp相关的力扣题-CSDN博客

本文链接：https://blog.csdn.net/l4kjih3gfe2dcba1/article/details/123563491

KMP算法（力扣）

题目：28. 实现 strStr()
实现 strStr() 函数。

给定一个 haystack 字符串和一个 needle 字符串，在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在，则返回 -1。

示例 1:
输入: haystack = “hello”, needle = “ll”
输出: 2

示例 2:
输入: haystack = “aaaaa”, needle = “bba”
输出: -1

说明:
当 needle 是空字符串时，我们应当返回什么值呢？这是一个在面试中很好的问题。
对于本题而言，当 needle 是空字符串时我们应当返回 0 。这与C语言的 strstr() 以及 Java的 indexOf() 定义相符。

最简方法

暴力比对,两层for循环

class Solution
{
public:
    int strStr(string haystack, string needle)
    {
        if (needle == "")
            return 0;
        if (haystack.size() < needle.size())
            return -1;
        for (int i = 0; i < haystack.size() - needle.size() + 1; ++i)
        {
            for (int j = 0; j < needle.size(); ++j)
            {
                if (haystack[i + j] != needle[j])
                    break;
                if (j == needle.size() - 1)
                    return i;
            }
        }
        return -1;
    }
};

KMP算法

思路:

当出现不匹配位时,暴力解中为从头开始。但是已匹配部分可能不用重新匹配，为节约这一已匹配部分时间，使用KMP算法对needle进行预处理

预处理：

建立与needle长度相等的int型数组arr，每个元素i与needle中对应位置字符对应，含义为：当前位之前的子序列前后缀相同的长度(l-1)。
操作：若当前位置下一位j+1的字符不匹配，则匹配字符串haystack位置不变，从needle的第i+1位开始继续匹配。（i<j）注：arr[0]=-1，指第0位不匹配时haystack向后移动一位。

void getNext(int* next, const string& s) {
    int j = -1;
    next[0] = j;
    for(int i = 1; i < s.size(); i++) { // 注意i从1开始
        while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
            j = next[j]; // 向前回溯
        }
        if (s[i] == s[j + 1]) { // 找到相同的前后缀
            j++;
        }
        next[i] = j; // 将j（前缀的长度）赋给next[i]
    }
}

一个理解，不一定对，帮助记忆
两个指针i和j，i从1开始for循环遍历到s.size()-1，j从-1开始。在每次i的循环中，将s[i]与s[j+1]对比，只要两者不同，j=next[j]向前回溯，如果实在没有则跳过if循环，next[i]=j；如果找到了相同的则j+=1，之后next[i]=j

在这里插入图片描述

这张图有误，最后两个指针指向bf进行比较后，前一个指针应直接回到0而不是先回到1再回到0

完整代码

class Solution {
public:
    void getNext(int* next, const string& s) {
        int j = -1;
        next[0] = j;
        for(int i = 1; i < s.size(); i++) { // 注意i从1开始
            while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
                j = next[j]; // 向前回溯
            }
            if (s[i] == s[j + 1]) { // 找到相同的前后缀
                j++;
            }
            next[i] = j; // 将j（前缀的长度）赋给next[i]
        }
    }
    int strStr(string haystack, string needle) {
        if (needle.size() == 0) {
            return 0;
        }
        int next[needle.size()];
        getNext(next, needle);
        int j = -1; // // 因为next数组里记录的起始位置为-1
        for (int i = 0; i < haystack.size(); i++) { // 注意i就从0开始
            while(j >= 0 && haystack[i] != needle[j + 1]) { // 不匹配
                j = next[j]; // j 寻找之前匹配的位置
            }
            if (haystack[i] == needle[j + 1]) { // 匹配，j和i同时向后移动 
                j++; 
            }
            if (j == (needle.size() - 1) ) { // 文本串s里出现了模式串t
                return (i - needle.size() + 1); 
            }
        }
        return -1;
    }
};