KMP算法—最容易理解的Next数组获取

kmp匹配算法其精髓就在于next数组的获取和采用。当然next数组的生成对于很多的人短暂理解可能很好接受,但是时间一久就会忘记,接下来用简短的代码和案例带大家领路next数组的魅力。

首先,我的思路中将查询字串数组的第一位(数组下标为零)的值定义为整个数组的长度。

T8aacabdca
下标012345678

next数组生成的精髓就在于回溯,下面我将根据代码进行详解,最后采用案例进一步剖析

//T为待匹配字符串,生成其对应的next下标数组。
void get_next(String T,int *next)
{
    int j = 0;
    int i = 1;//因为把T的零位用来存储数组长度了,所以从下标一开始
    next[1] = 1;

    while(i < T[0])//遍历T数组下标
    {
        if( 0 == j || T[i] == T[j] )//0==j是一种习惯,可以最快时间的发现j是否被定义
        {
            i++;
            j++;
            next[i] = j;
        } else {
            j = next[j];
        }
    }
}

首先定义i和j,i用来遍历T数组一直往后走,j用来实现回溯效果。

T8aacabdca
下标012345678

首先,T[1]的下标为零,因为T数组我们将其的第零位放置了长度,所以next数组的第一位匹配不到的时候要采用j=next[j]进行定位下次T数组的位置,要定位到第一位。

T8aacabaac
下标012345678
执行if之前j的值000112123
nextx11121234
j001121234

当数组下标i为5时因为其前一位和第一位相同,所以下次比较只需要从第二位开始即可,然后将T[5]定为比较的第一位与开头进行比较。

对比的精髓就是将第i位分别作为起始位,对比其后多少位与从数组开头开始算往后相等

即:

acdaceef
acda

c

f
acda

c

f

解释为,下面为匹配数组,上面为原数组,对于下面数组可以观察到,acd和acf前两位一样,当f处出现匹配错误的时候,我们则不需要再比较ac,只需要定位到第三位即可。

int kmp(String s ,String T , int pos)
{
    int i = pos;
    int j = 1;
    int next = [255];

    get_next(T,next);
    
    while (i <= S[0] && j <= T[0])
    {
        if(s[i] = T[j])
        {
            i++;j++;
        } else {
             J = next[j];
        }
    }
    
    if(j > T[0])
    {
        return i - T[0];
    } else {
        return 0;
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值