KMP

KMP就是一种快速在A串中查找B串的算法。

算法流程大概如下:

A=ababaabacb

B=aba

定义两个指针:i , j

                                   i

                                  v

                                  ababaabacb

                                  aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                                ababaabacb

                                aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                              ababaabacb

                              aba

                                  ^

                                   j(匹配成功,次数加一)

______________________________

                                   i

                                  v

                              ababaabacb

                                  aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                            ababaabacb

                                aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                          ababaabacb

                              aba

                                  ^

                                   j(匹配成功,次数加一)

______________________________

                                   i

                                  v

                          ababaabacb

                                  aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                        ababaabacb

                                aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                        ababaabacb

                                  aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                      ababaabacb

                                aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                    ababaabacb

                              aba

                                  ^

                                   j(匹配成功,次数加一)

______________________________

                                   i

                                  v

                  ababaabacb

                                  aba

                                  ^

                                   j

______________________________

                                   i

                                  v

                ababaabacb

                                  aba

                                  ^

                                   j

______________________________

以上就是KMP算法的全过程

关键在于求出模式串在与文本串失配后应该让自己的第几位与文本串此时匹配到的位置对齐。(求next数组)

求next数组的过程如下(a——文本串,b——模式串):

for (i=start;i<=end;i++) //start指匹配的起点,end指终点,一般start=1,end=n
    next[i]=start-1;    //一般这一个循环就写作next[start]=start-1一句话
j=start-1;    //开始求next
for (i=start/*重点*/;i<end;i++) {    //这里的i是比j大1的,为什么?(“自己与自己匹配”)
    while (j>(start-1) && b[j+1]!=b[i+1]) j=next[j];//当匹配不成功,就跳到上一个可能成功的位置
    if (b[i+1]==b[j+1]) j++;    //b[i+1]与此时的b[j+1]相等的话就有next[i+1]=j+1;
    next[i+1]=j;
}

匹配过程如下:

j=start-1;
for (i=start-1/*注意*/;i<end;i++) {
    while (j>start-1 && b[j+1]!=a[i+1]) j=next[j];
    if (b[j+1]==a[i+1]) j++;
    if (j==strlen(b)) {//匹配到第串长位,匹配完成(因为位数是从0开始的)
        ...
        j=next[j]; //继续匹配
    }
}

大概就是这样了。

模板传送门

我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法。KMP算法是拿来处理字符串匹配的。换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串)。比如,字符串A="I'm matrix67",字符串B="matrix",我们就说B是A的子串。你可以委婉地问你的MM:“假如你要向你喜欢的人表白的话,我的名字是你的告白语中的子串吗?” 解决这类问题,通常我们的方法是枚举从A串的什么位置起开始与B匹配,然后验证是否匹配。假如A串长度为n,B串长度为m,那么这种方法的复杂度是O (mn)的。虽然很多时候复杂度达不到mn(验证时只看头一两个字母就发现不匹配了),但我们有许多“最坏情况”,比如,A= "aaaaaaaaaaaaaaaaaaaaaaaaaab",B="aaaaaaaab"。我们将介绍的是一种最坏情况下O(n)的算法(这里假设 m<=n),即传说中的KMP算法。 之所以叫做KMP,是因为这个算法是由Knuth、Morris、Pratt三个提出来的,取了这三个人的名字的头一个字母。这时,或许你突然明白了AVL 树为什么叫AVL,或者Bellman-Ford为什么中间是一杠不是一个点。有时一个东西有七八个人研究过,那怎么命名呢?通常这个东西干脆就不用人名字命名了,免得发生争议,比如“3x+1问题”。扯远了。 个人认为KMP是最没有必要讲的东西,因为这个东西网上能找到很多资料。但网上的讲法基本上都涉及到“移动(shift)”、“Next函数”等概念,这非常容易产生误解(至少一年半前我看这些资料学习KMP时就没搞清楚)。在这里,我换一种方法来解释KMP算法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值