串的模式匹配算法2-KMP算法

写在前面:

这些是我学习的时候的一些个人理解和笔记,如有错误,欢迎指正。

2.KMP

子串的定位运算通常称为串的模式匹配或是串匹配。著名的算法有BF算法KMP算法

2.1

  • 这种算法是由Knuth、Morris和Pratt同时设计实现的,因此称为KMP算法。
  • KMP算法是对BF算法的改进,在BF算法中,i和j指针都要进行回溯,但是在KMP算法中,i指针是不用回溯的,而是利用已经得到的“部分匹配”的结果将模式串T向右“滑动”尽可能远的一段距离之后继续进行比较。
    • 最坏的情况:主串S:aaaaaaaaab 模式串T:aaab,找起来就会很慢
  • BF算法的时间复杂度是 O(n*m),KMP算法时间复杂度是 O(n*m)

2.2求next[ j ]和nextval[ j ]的做题方法

  • https://www.bilibili.com/video/BV1jY4y177Ci/?spm_id_from=333.999.0.0

next[ j ]:需要找到子串中最长的相同前后缀的长度。
nextval[ j ]:需要比较 下标为next[ j ]和当前的字符是否相等。
在这里插入图片描述
在这里插入图片描述

2.3代码

KMP算法
int Index_KMP(SString S,SString T,int pos)
{//T非空,i<=pos<=S.length
    i=pos;j=1;
    while(i<S.length && j<=T.length)
    {
        if(j==0||S.ch[i]==T.ch[j])
        {
            ++i;++j;
        }
        else    j=next[j];
        if(j>T.length)  return i-T.length;
        else return 0;
    }
}
计算next函数值
void get_next(SString T,int next[])
{
    i=1;    next[1]=0;  j=0;
    while(i<T.length)
    {
        if(j==0||T.ch[i]==T.ch[j]){++i;++j;next[i]=j;}
        else j=next[j];
    }
}
计算next函数修正值(nextval)
void get_nextval(SString T ,int nextval[])
{
    i=1;nextval[1]=0;j=0;
    while(i<T.length)
    {
        if(j==0||T.ch[i]==T.ch[j])
        {
            ++i;++j;
            if(T.ch[i]!=T.ch[j])    nextval[i]=j;
            else nextval[i]=nextval[j];
        }
        else j=nextval[j];
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BF算法KMP算法都是模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主和模式的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式较长时,KMP算法的效率更高。 下面是BF算法KMP算法的介绍和演示: 1. BF算法(暴力匹配算法) BF算法是一种朴素的模式匹配算法,它的思想是从主的第一个字符开始,依次和模式的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主的下一个字符开始重新匹配。BF算法的时间复杂度为O(m*n)。 下面是BF算法的Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法(Knuth-Morris-Pratt算法KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式与主的匹配次数。具体来说,KMP算法通过预处理模式,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法的Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值