Leetcode28. kmp算法实现字符串匹配

Leetcode28. Implement strStr()

题目

Implement strStr().
Returns the index of the first occurrence of needle in haystack, or -1 if needle is not part of haystack.

解题分析

提到字符串匹配,就不得不提及kmp算法。kmp算法巧妙地消除了指针i的回溯问题,只需确定下次匹配j的位置即可,使得问题的复杂度由O(m*n)下降到O(m+n)。在kmp算法中,为了确定在匹配不成功时下次匹配时j的位置,引入了next[]数组,next[j]的值表示needle[0…j-1]中最长后缀的长度等于相同字符序列的前缀。
kmp算法的思想就是:在匹配过程中,若发生不匹配的情况,如果next[j]>=0,则目标串的指针i不变,将模式串的指针j移动到next[j]的位置继续进行匹配;若next[j]=-1,则将i右移1位,并将j置0,继续进行比较。
kmp算法的关键在于求算next[]数组的值,即求算模式串每个位置处的最长后缀与前缀相同的长度。
根据定义next[0]=-1,假设next[j]=k, 即needle[0…k-1]==needle[j-k,j-1]。若needle[j]==needle[k],则有needle[0..k]==needle[j-k,j],很显然,next[j+1]=next[j]+1=k+1。若needle[j]!=needle[k],则可以把其看做模式匹配的问题,即匹配失败的时候,可知k=next[k]。

源代码

class Solution {
public:
    int strStr(string haystack, string needle) {
        int size1 = haystack.size(), size2 = needle.size(), i = 0, j = 0;
        if (size2 == 0) {
            return 0;
        }
        int* next = new int[size2];
        getNext(needle, next);
        while (i < size1) {
            if (j == -1 || haystack[i] == needle[j]) {
                i++;
                j++;
            }
            else {
                j = next[j];
            }
            if (j == size2) {
                return i - size2;
            }
        }
        return -1;
    }

    void getNext(string s, int* next) {
        int j = 0, k = -1;
        next[0] = -1;
        while (j < s.size() - 1) {
            if (k == -1 || s[j] == s[k]) {
                j++;
                k++;
                next[j] = k;
            }
            else {
                k = next[k];
            }
        }
    }
};

以上是我对这道问题的一些想法,有问题还请在评论区讨论留言~

KMP算法是一种字符串匹配算法,用于在一个文本串S内查找一个模式串P的出现位置。它的时间复杂度为O(n+m),其中n为文本串的长度,m为模式串的长度。 KMP算法的核心思想是利用已知信息来避免不必要的字符比较。具体来说,它维护一个next数组,其中next[i]表示当第i个字符匹配失败时,下一次匹配应该从模式串的第next[i]个字符开始。 我们可以通过一个简单的例子来理解KMP算法的思想。假设文本串为S="ababababca",模式串为P="abababca",我们想要在S中查找P的出现位置。 首先,我们可以将P的每个前缀和后缀进行比较,得到next数组: | i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | | --- | - | - | - | - | - | - | - | - | | P | a | b | a | b | a | b | c | a | | next| 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 | 接下来,我们从S的第一个字符开始匹配P。当S的第七个字符和P的第七个字符匹配失败时,我们可以利用next[6]=4,将P向右移动4个字符,使得P的第五个字符与S的第七个字符对齐。此时,我们可以发现P的前五个字符和S的前五个字符已经匹配成功了。因此,我们可以继续从S的第六个字符开始匹配P。 当S的第十个字符和P的第八个字符匹配失败时,我们可以利用next[7]=1,将P向右移动一个字符,使得P的第一个字符和S的第十个字符对齐。此时,我们可以发现P的前一个字符和S的第十个字符已经匹配成功了。因此,我们可以继续从S的第十一个字符开始匹配P。 最终,我们可以发现P出现在S的第二个位置。 下面是KMP算法的C++代码实现
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值