kmp算法(自用)

做字符串模式匹配时用到.
无论是c/c++还是java,字符串的查找方法的时间复杂度都是n2,而kmp是n的复杂度.
kmp的关键步骤(代码是直接在网上借鉴的)
1.求出要匹配字符串的next数组(前i-1个的字符串的最长相同真前后缀长度)

/* P 为模式串,下标从 0 开始 */
void GetNext(string P, int next[])
{
    int p_len = P.size();
    int i = 0;   // P 的下标
    int j = -1;  //相同前后缀长度,同时是下标
    next[0] = -1;

    while (i < p_len - 1)
    {				//j一定比i小
        if (j == -1 || P[i] == P[j])//可以理解为j每次都从开头重新匹配
        {
            i++;
            j++;
            next[i] = j;
        }
        else
            j = next[j];//自己匹配自己,回到上一个相同前后缀的地方其实j=-1也行(对时间影响不大除非数据特别挑剔)
    }
}

2.利用next数组进行快速匹配

/* 在 S 中找到 P 第一次出现的位置 */
int KMP(string S, string P)
{
    GetNext(P, next);

    int i = 0;  // S 的下标
    int j = 0;  // P 的下标
    int s_len = S.size();
    int p_len = P.size();

    while (i < s_len && j < p_len)//结束条件S遍历结束或完全匹配
    {
        if (j == -1 || S[i] == P[j])  // P 的第一个字符不匹配或 S[i] == P[j]
        {
            i++;
            j++;
        }
        else
            j = next[j];  // 当前字符匹配失败,进行跳转(前缀相同,直接视为已经匹配)
    }

    if (j == p_len)  // 匹配成功
        return i - j;//下标
    
    return -1;
}

优化后的kmp的getNext(防止了重复匹配相同的无效前缀,不能用来解决字符串重复问题,但速度快)

/* P 为模式串,下标从 0 开始 */
void GetNextval(string P, int nextval[])
{
    int p_len = P.size();
    int i = 0;   // P 的下标
    int j = -1;  
    nextval[0] = -1;

    while (i < p_len - 1)
    {
        if (j == -1 || P[i] == P[j])
        {
            i++;
            j++;
          
            if (P[i] != P[j])
                nextval[i] = j;
            else
                nextval[i] = nextval[j];  // 既然相同就继续往前找真前缀
        }
        else
            j = nextval[j];
    }
}

kmp算法比较难理解,博主也还没完全弄明白,本篇代码借鉴处—>KMP算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值