KMP算法next数组通俗理解,适合考研及基础学习者


KMP算法是主要用来做字符串的匹配,有一个文本次T和一个模式串P,就是拿模式串P去匹配文本串T。

匹配的步骤分为两步,先做模式串自身匹配,即求出next数组;然后在进行T与P的匹配。


那么可能会问,为什么要做模式串自身匹配,这么做的优点体现在哪里?

                            next数组到底是干啥的?它的含义是什么?

                            怎么求next数组?

                            T与P的匹配过程具体是怎么操作的?

       这些应该都是初学者期盼搞懂的问题,但是在看了花花绿绿的资料和代码过后忽略了的问题,感觉似懂非懂,好像也还能做题,就算做不出来,看了题解好像也能明白,然而过段时间,当别人再问你KMP是什么的时候,却又讲不出关键。。。我自己学习这个东西的心路历程好像就是这样的。大一暑假拉着某学长给我讲了KMP,听完后感觉一脸懵逼,虽然后来刷了一些题目,但很快就又不会写。最近 考研的室友复习到KMP,折腾了几天不是很懂后,让我给讲一讲,先跟她交流了下哪里不懂,然后专门去探究了一下,发现在给室友讲解的过程中,她一次次提问,也算是自己一步步加深理解的过程吧(这种大家一起探究问题的感觉挺欢乐的=。=)

 先举一个栗子吧下面。

               0 1 2 3 4 5 6 7 8 9 10 11

文本串T   b a b a b a b c a b  a  b

模式串P   a b a b c a b a b 

模式串自匹配过程:

void Next()
{
    int i=0;
    int j=-1;
    next[0]=-1;
    int len=s.length();
    while(i<len)
    {
        if(j==-1||s[i]==s[j])
        {
            i++;
            j++;
            next[i]=j;
        }
        else
            j=next[j];
    }
}

i=0  j=-1 n[0]=-1

i=1 j=0 n[1]=0

i=1 j=n[j]=-1

i=2 j=0 n[2]=0

i=3 j=1 n[3]=1

i=4 j=2 n[4]=2

i=4 j=n[2]=0

i=4 j=n[0]=-1

i=5 j=0 n[5]=0

i=6 j=1 n[6]=1

i=7 j=2 n[7]=2

i=8 j=3 n[8]=3

i=9 j=4 n[9]=4

起初i=0,j=-1,在判断时,当j=-1或p[i]=p[j]时,i ,j的值共同前进,记录next数组的值。当出现不匹配的时候,j值就后退,而后退方法只有一个 j=next[j]

那么,next数组记录的是什么?从例子里面来看,n[8]=3,代表的含义有三个。此时i=8 ,j=3,1.当前比较的位置到了8,2.当前最大匹配长度为3,3.0~2和5~7这两段的字符串相同。可以总结一下,对于next[i]=j 同样也是一个道理,1.当前比较的位置到了i,2.当前最大匹配长度为j,3.0~(j-1) 和 (i-j)~(i-1) 这两段的字符串相同

int fun () //匹配过程
{
    int i=0;
    int j=0;
    int len1=p.length(); //模式串
    int len2=s.length(); //文本串
    while(i<len2 && j<len1)
    {
        if(j==-1||s[i]==p[j])
        {
            i++;
            j++;
        }
        else
        {
             j=next[j];
        }
    }
    if(j==len1)
        return i-len1;
    else
        return -1;
}

               0 1 2 3 4 5 6 7 8 9 10 11

文本串T   b a b a b a b c a b  a  b

模式串P   a b a b c a b a b 


匹配过程和求next数组过程几乎一模一样,但是含义却不同

i=0  j=0

i=0 j=n[0]=-1

i=1 j=0

i=2 j=1

i=3 j=2

i=4 j=3

i=5 j=4 //此时T[5]和P[4]不匹配 ,j开始回退 j=next[j]

i=5 j=n[4]=2  //此时T[5]和P[2]匹配上了,含义是什么?那就是,(i-j~i-1)段字符串和(0~j-1)段字符串是匹配的 ,开始比较T[i]和P[j]位置是否相等

//如果不相等那么j将继续回退,一直退到 j=-1就是到了尽头为止,此时 i 和 j 会同时加一,即当前对于i位置来说,已经没有可以匹配的前缀的,那就i前进一位再开始比较看看吧

i=6 j=3

i=7 j=4 

i=8 j=5

i=9 j=6

i=10 j=7

i=11 j=8


KMP最重要的就是弄懂next数组的含义,理解了其中的丰富内涵,就能应对变化的题目了。记下一些自己的心得,感觉也还算通俗易懂的吧。














   


                             

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值