KMP理解

处理字符串匹配问题,最简单直接的方法是BF算法,原串用i表示指向的字符位置,模式串用j表示。开始从i=0,j=0比较str[i]和mo[j]是否相等。若相等i++,j++。若不相等,j重新指向0位置,i从第二个str[1]开始......。这样时间复杂度为l1*l2.。比较耗时。

而KMP利用模式串相同的前缀后缀。j指针回溯,i指针不回溯。因为匹配到模式串的j时说明前j-1个串一定是全匹配的,下次的匹配不需要j从0开始,下次匹配成功的地方一定是从j=Next[j]处开始的,当匹配出现str[i]!=mo[j]时,j指针指向Next[j]的位置,其中用Next[j]表示前0~j-1这个串中的相同前缀后缀的最长长度。如例子匹配到j=5时str[i]!=mo[j],j回到Next[j],再比较str[i]与mo[j],为什么不把j=0与i=1开始匹配呢,因为这样匹配的话,成功的条件是主串的从第二位开始后的串baab和模式串的abaa是相等的串,而满足它的条件是j=5时的j前面的串的前后缀相等的长度可达到4,即若Next[j]!=4时str[1]和mo[0]是不可能匹配成功的;所以下次从模式串Nextj][和主串的i(上次匹配不成功出现的位置)比较,模式串的0~Next[j]个字符一定和主串i前面的next[j]个字符匹配。难点在于Next[]数组如何求。


abaabaabbabaaabaabbabaa   原串str

abaabbabaab 模式串


前缀不包括最后一个字符,后缀不含第一个字符,所以求模式串第j位前的串的相等前后缀,要把j从0和i从1开始。
void getNext()
{
    int i=0;
    int j=-1;
    int len=strlen(mo);
    while(i<len)
    {
        if(j==-1||mo[i]==mo[j])
        {
            i++;
            j++;
            Next[i]=j;
        }
        else
            j=Next[j];
    }
}
计算主串中有几个模式串

int kmp()
{
    int i=0;
    int j=0;
    int ans=0;
    int l1=strlen(str);
    int l2=strlen(mo);
    while(i<l1)
    {
        if(j==-1||mo[j]==str[i])
        {
            i++;
            j++;
        }
        else j=Next[j];
        if(j==l2) ans++;
    }
    return ans;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值