KMP算法

KMP算法

用途

kmp算法通常用于匹配字符串中的目标字符串

暴力做法

思路

 暴力做法思路很简单,假设被搜索字符串为a,目标字符串为b,用i表示a中当前进行比较的字符的位置,用j表示当前进行比较的字符的位置。

代码

int violent(string a,string b)
{
    int i = 0;
    int j = 0;
    for(i = 0; i <= a.length()-b.length(); i++)
    {
        int can = 1;
        for (j = 0; j<b.length(); j++)
        {
            if(b[j]!=a[j+i])
            {
                can = 0;
                break;
            }
         }
        if(can) return i;
    }
    return -1;
}

KMP算法

优化思路

以搜索字符串 String1 = abababcab 和目标字符串 String2 = ababc为例
用 i 表示搜索字符串的比较字符位,用 j 表示字符串的比较字符位
在进行比较的时候,如果String1[ i ] == String2[ j ],那么比较他们的下一个字符,当比较到String1中的ababa时,我们发现最后一个 'a' 与 String2 中的 'c' 不同
按照暴力搜索的做法,此时j需要归0,从头进行比较
但是....!此时我们发现 'c'前面的 "abab" 和 String1的那个 'a' 前面的 "abab"完全匹配,那么此时我们将j回退两位,此时j前面为 "ab",继续进行比较。
进行回退操作的前提是在该出错字符前存在两个相同的子串,才能跳到前子串重新比较。

目标串回退

次数回退位置
10
20
31
42

从上面可知,其实就是回退到最长两相同子串的前子串的后一位

next数组的实现

关键问题在于 j 要回退到哪一位,在KMP算法中我们使用一个next数组储存我们的回退位

void GetNext(string b, int next[])
{
    long len = b.length();
    next[0] = -1;
    int j = 0;
    int k = -1;
    while (j < len - 1)
    {
        if(k == -1||b[j]==b[k])
        {
            k++;
            j++;
            next[j] = k;
        }
        else k = next[j];
       // 回退到前一个最长重复子串的后一位
    }
}

查找字符串具体实现

int KMP(string a, string b)
{
    GetNext(b, Next);
    long i = 0;
    long j = 0;
    long alen = a.length();
    long blen = b.length();
    while (i < alen && j < blen)
    {
        if(j == -1 || a[i] == b[j])
        {
            i++;
            j++;
        }
        else
        {
            j = Next[j];
        }
    }
    if(j==blen) return i-j;
    // i-j即为此时起始匹配字符的位置
    return -1;
    // 如果不存在,返回-1
}
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值