KMP算法

最简单的字符串算法,用于寻找字符串是否在文本中出现过

首先了解前缀和与后缀和:

字符串"ababc"的前缀包括:ε(空串)、"a"、"ab"、"aba"、"abab"和"ababc"

字符串"ababc"的后缀包括:ε(空串)、"c"、"bc"、"abc"、"babc"和"ababc" 

在kmp中,前后缀应该去除本身和空串

以为例abcab

如果前后缀相同那么就意味着

a b c a b 
      a b c a b  

这样在匹配时可以直接向后移,从而减少朴素算法的时间复杂度

一个较为简单的next函数

void get_next(string s,int *a)
{
    for(int i = 1;i <= s.size();++i)
    {
        string str = s.substr(0,i);//字串
        for(int j = 1;j < str.size();++j)
        {
            string x = str.substr(0,j);//前缀和
            string y = str.substr(str.size()-j);//后缀和
            if(x == y) a[i-1] = x.size();
        }
    }
}

效率较高的next函数

void get_next(string s, int *next)
{
    int i = 1,j = 0;
    next[0] = 0;
    while(i < s.size())
    {
        if(j == 0 || s[i] == s[j]) next[++i] = ++j;
        else j = next[j];
    }
}

KMP算法实现如下

#include <bits/stdc++.h>

using namespace std;

void get_next(string s, int *next)
{
    int i = 1,j = 0;
    next[0] = 0;
    while(i < s.size())
    {
        if(j == 0 || s[i] == s[j]) next[++i] = ++j;
        else j = next[j];
    }
}

int KMP(string s1,string s2,int *next)
{
    int i = 0,j = 0;
    for(;i < s1.size() && j < s2.size();++j,++i)
    {
        if(s1[i] != s2[j])
        {
            if(j != 0) j = next[j-1];
            else j = 0;
        }
    }
    if(j == s2.size()) return i-j;
    else return -1;
}

int main()
{
    string s1 = "aabaabaaf";
    string s2 = "aabaaf";
    int next[s2.size()];
    fill(next,next+s2.size(),0);
    get_next(s2,next);
    cout << KMP(s1,s2,next);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值