kmp算法简单讲解

上午学习了kmp算法的思想,下午学习了如何实现kmp算法,并对这些内容进行了总结。

写在前面

文章中可能会先讲解很多貌似毫不相关的知识点,但这些都是学习kmp算法需要知道的东西,先了解这些知识点后我们就可以更好的理解kmp算法了。

目录

kmp的作用

暴力算法简介

kmp算法相对于暴力算法的优化

前后缀

最长相等前后缀

获取前缀值

构建前缀表


kmp的作用

在一个已知字符串(文本串)中查找子串(模式串)的位置,也叫做串的模式匹配。

暴力算法简介

从主串s 和子串t 的第一个字符开始,将两字符串的字符一一比对,如果出现某个字符不匹配,主串回溯到第二个字符,子串回溯到第一个字符再进行一一比对......一直到子串字符全部匹配成功。

最好的时间复杂度:O(n)

最坏的时间复杂度:O(m*n)

kmp算法相对于暴力算法的优化

KMP 算法主要是通过消除主串指针的回溯,以及改变字串回溯的位置来提高匹配的效率的

具体实现就是通过一个next()函数(即构造的前缀表)实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)

前后缀

前缀表示包含第一个字符,但不包含最后一个字符的字串

后缀表示包含最后一个字符,但不包含第一个字符的字串

上例子:

字符串 abcdab
前缀的集合:{a,ab,abc,abcd,abcda}
后缀的集合:{b,ab,dab,cdab,bcdab}

最长相等前后缀

字符串 abcdab
前缀的集合:{a,ab,abc,abcd,abcda}
后缀的集合:{b,ab,dab,cdab,bcdab}
最长相等前后缀就是ab

理解了这里,关于kmp算法子串回溯到哪个字符,现在可以着手解决了

获取前缀值

事实上,每一个字符前的字符串都有最长相等前后缀,而且最长相等前后缀的长度是我们移位的关键,所以我们单独用一个next数组存储子串的最长相等前后缀的长度。

next数组即我们需要构造的前缀表

每一个字符前的字符串的最长相等前后缀即该字符的前缀值

前缀值:

前缀值不仅仅代表着对应位置字符串前后缀相同元素长度的最大值

因为是前后缀的公共元素,它还可以表示该位置与从字符串首位起固定位置的字符相同,即指向自身与其相同的元素的位置。

文本串用例:ABABD

前缀表(前缀值表)
在这里插入图片描述

对于任意一个字符串,我们很容易得到它的第一个前缀字符(数组索引为0)对应的前缀值一定为0(因为第一个前缀字符只有一个字符A没有前后缀,所以也不存在公共元素)

构建前缀表

分为三步:
1、初始化
2、前后缀的末尾不相同时怎么处理
3、前后缀的末尾相同时怎么处理

void getnext(next,s)
{
 j=0;
 next[0]=0;//初始化
 for(i=1;i<s.size();i++)
 {
  	while(j>0&&s[i]!=s[j])//前后缀的末尾不相同时怎么处理
		j=next[j-1];//往前面的next数组里找一个j,使s[i]==s[j] 
   		//意思是说,一旦s[i] != s[j],即不能继续延长最大相等前后缀的值
		//就跑到已经对比过的前缀里对比,next[j-1]就是前一个位置最大相等前后缀的值
 	if(s[i]==s[j]) j++;//前后缀的末尾相同时怎么处理
    	next[i]=j;
 }
}

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值