day11-KMP

最新推荐文章于 2024-10-17 11:39:06 发布

Jasper_Fish

最新推荐文章于 2024-10-17 11:39:06 发布

阅读量104

点赞数

分类专栏：算法文章标签：算法

本文链接：https://blog.csdn.net/weixin_62654344/article/details/131871605

版权

算法专栏收录该内容

36 篇文章 0 订阅

订阅专栏

文章介绍了如何使用KMP算法解决力扣上的strStr()函数问题。KMP算法主要涉及构造next数组来处理字符串的最长公共前后缀，通过next数组在主串中进行高效的匹配，避免不必要的回溯。文章详细阐述了next数组的构建过程和匹配过程，并提供了相应的代码实现。

摘要由CSDN通过智能技术生成

KMP

力扣题目链接(opens new window)

实现 strStr() 函数。

给定一个 haystack 字符串和一个 needle 字符串，在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在，则返回 -1。

示例 1: 输入: haystack = “hello”, needle = “ll” 输出: 2

示例 2: 输入: haystack = “aaaaa”, needle = “bba” 输出: -1

说明: 当 needle 是空字符串时，我们应当返回什么值呢？这是一个在面试中很好的问题。对于本题而言，当 needle 是空字符串时我们应当返回 0 。这与C语言的 strstr() 以及 Java的 indexOf() 定义相符

思路

这道题是经典的KMP题，KMP流程大致为以下：

next数组
匹配

next数组

构造匹配串的next数组，首先要知道什么是前缀、后缀以及最长公共前后缀。

前缀即一个字符串不包含最末字符的所有子串，如：aabsd，它的前缀有a、aa、aab、aabs，

而后缀同理，不包含第一个字符的所有子串，同样是上面的例子，它的后缀为：d、sd、bsd、absd

而最长公共前后缀则是前后缀集合中相等的最大长度串。

next数组的每一位的意义是：当前位置的前面字符串的最长公共前后缀长度（不包含当前字符）。

加入当前有串：aabaaf

经过计算，它的next数组为：010120。

代码思路

首先要比较前后缀，我们需要定义两个指针

prefix_end：指向前缀最末字符所在位置
suffix_end：指向后缀最末字符所在位置

初始化

prefix_end = 0
next[0] = prefix_end;

处理前后缀不相等

for(suffix_end = 1;suffix_end < s.size();suffix_end++)
{
    while(prefix_end > 0 && s[prefix_end] != s[suffixe_end]){
        prefix_end = next[prefix_end - 1];
    }
}

这里将suf初始化为1，开始循环，如果遇到不相等的字符，则进行回退，回退的方法就是跳到前一个匹配的位置，即取next数组的前一位。

处理前后缀相等

if(s[prefix_end] == s[suffix_end]){
    prefix_end ++;
}

如果字符相等，则同时向前移动。

最后对next数组进行更新

next[suffix_end] = prefix_end

匹配

KMP的思路就是，每当字符不相等时，将当前的匹配串下标值改为next数组的前一位。这么说好像有点抽象，代码如下：

int j=0;
for(int i=0;i<s.size();i++){
    while(j>0 && s[i] != p[j]){
        j = next[j-1];
    }
    if(s[i] == p[j])j++;
    if(j == p.size()){
        return i - p.size() +1; //返回初始匹配位置
    }
}

整体代码

class Solution {
public:
    int strStr(string haystack, string needle) {
        if (needle.size() == 0)return 0;
        vector<int> next(needle.size(),0);
        getNext(next,needle);
        // begin to match
        int res_index=-1;
        int match_index = 0;
        for (int i = 0; i < haystack.size(); ++i) {
            while (match_index > 0 && haystack[i] != needle[match_index])
            {
                match_index = next[match_index-1];
            }
            if (haystack[i] == needle[match_index]) match_index++;
            if (match_index == needle.size()){
                return i - needle.size() + 1;
            }
        }
        return -1;
    }
    void getNext(vector<int> &next, const string s)
    {
        int prefix_end = 0;
        next[0] = prefix_end;
        for (int suffix_end = 1; suffix_end < s.size(); ++suffix_end) {
            // 处理不相等的情况
            while(prefix_end > 0 && s[prefix_end] != s[suffix_end])
            {
                prefix_end = next[prefix_end -1];
            }
            if (s[prefix_end] == s[suffix_end])
            {
                prefix_end++;
            }
            next[suffix_end] = prefix_end;
        }
    }

};