KMP算法

  • 基本场景
  • 核心思想
  • 扩展加深

基本概念

KMP算法用于字符串的匹配,假定现在需要在s1中查找s2,暴力解就是直接去遍历查看是否匹配,显然这样的时间复杂度显然是O(MN)的,而字符串通过引入前缀串和后缀串的信息,来进行一个匹配上的加速。个人觉得优秀的算法就是对已经获取的信息减少后续的重复获取,下面就让我们进入KMP算法的核心思想去体会如何有效利用已经获取的信息。

核心思想

  • 前缀串后缀串
    用一个next数组存储前缀串和后缀串的最大长度 求法看下图
    //next数组求法图
    这里写图片描述
  • 为何next数组加速
    显然我们需要next数组的信息为我们加速,具体理解过程看图呗 ^v^
    //利用next数组加速图
    这里写图片描述
    //为何这样加速图
    这里写图片描述
  • 代码演示
    如果上述你没有理解,那就先放下,看代码,同样会有代码的图解,然后结合上述理解
int MyKmp(string s1,string s2) {
    if( s2.size()>s1.size() ) return -1;
    int arr[s2.size()];
    GetNextArray( s2,arr,sizeof(arr)/sizeof(arr[0]) );

    int i=0,j=0;
    while( i<s1.size()&&j<s2.size() ) {
        if( s1[i]==s2[j] ) {  //大家都加加
            i++;
            j++;
        }
        else if( next[j]>0 ) //不相等 但是存在s1的后缀与s2的前缀相等(部分相等)
            j = next[j];
        else {   //大家完全不等
            i++
            j = 0;
        }
    }

    return j==s2.siize()?i-j:-1;
}

//代码图解
这里写图片描述
备注:当当前字符不存在前缀串和后缀串相等时,那么这段区间显然不会相等
这里写图片描述

  • next数组的求法
void GetMaxArray(string s,int* next,int size) {
    if( size==1 ) {
        next[0] = -1;
        return;
    }

    next[0] = -1;
    next[1] = 0;
    int cn = 0,cur = 2;
    while( cur<size ) {
        if( s[cur]-1==s[cn] ) 
            next[cur++] = ++cn;
        else if( next[cn]>0 )
            cn = next[cn];
        else
            next[cur++] = 0;
    }   
}

//next数组
这里写图片描述
next数组这样求取是因为 到达新的位置时 利用前面已有的字符串前后缀信息 看能否追加上去

扩展加深

  • 利用已有字符串向后添加字符,最终生成的字符串包含两个原始串,两个原始串开始位置不一样,求这样的最短串
    eg: abcabc
    添加后:abcabcabc
    思路:算出整体串的最长前缀和最长后缀,追加中间的部分
    这里写图片描述
    显然时next数组的应用,KMP算法的核心就是next数组。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值