【数据结构】了解KMP算法和部分匹配值、以及next函数值

最近生活发生了很多变化,没变的是自己还是咸鱼一条,害~~

1、什么是KMP算法

KMP算法是一种改进的字符串匹配算法。

2、KMP算法的思想

KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。

3、KMP算法的具体实现

实现一个next()函数,函数本身包含了模式串的局部匹配
信息

4、部分匹配值的定义

"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。

4.1 “前缀”和“后缀”的定义

"前缀"指除了最后一个字符以外,一个字符串的全部头部
组合;
"后缀"指除了第一个字符以外,一个字符串的全部尾部组
合。

4.2 相关例子

以"ABCDABD"为例,
-"A"的前缀和后缀都为空集,共有元素的长度为0;
-"AB"的前缀为[A],后缀为[B],共有元素的长度为0;
-"ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0; -"ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元
素的长度为0;
-“ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA,
DA, A],共有元素为"A”,长度为1;
-“ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为
[BCDAB, CDAB, DAB, AB, B],共有元素为"AB”,长度为2; -"ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后
缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。
在这里插入图片描述

5、移动位数的计算

公式(移动位数 = 已匹配的字符数 - 对应的部分匹配
值 )

6、next函数值相关计算题

例:在字符串的KMP模式匹配算法中,需先求解模式串p的
next函数值,其定义如下。若模式串p为“abaabaca”,则其
next函数值为(B)
在这里插入图片描述
A.01111111 B.01122341
C.01234567 D.01122334
解:
给定的字符串叫做模式串T。j表示next函数的参数,其值是从
1到n。而k则表示一种情况下的next函数值。p表示其中的某
个字符,下标从1开始。看等式左右对应的字符是否相等。
在这里插入图片描述
1、j=1时,next[1]=0;
2、j=2时,k的取值为(1,j)的开区间,所以整数k是不存在的,
那就是第三种情况,next[2]=1;
3、j=3时,k的取值为(1,3)的开区间,k从最大的开始取值,
然后带入含p的式子中验证等式是否成立,不成立k取第二大
的值。现在是k=2,将k导入p的式子中得,p1=p2,即
“a”=“b”,显然不成立,舍去。k再取值就超出范围了,所以
next[3]不属于第二种情况,那就是第三种了,即next[3]=1;
4、j=4时,k的取值为(1,4)的开区间,先取k=3,将k导入p
的式子中得,p1p2=p2p3,不成立。 再取k=2,得p1=p3,成
立。所以next[4]=2;
5、j=5时,k的取值为(1,5)的开区间,先取k=4,将k导入p
的式子中得,p1p2p3=p2p3p4,不成立。 再取k=3,得
p1p2=p3p4,不成立。 再取k=2,得p1=p4,成立。所以
next[5]=2;
6、j=6时,k的取值为(1,6)的开区间,先取k=5,将k导入p
的式子中得,p1p2p3p4=p2p3p4p5,不成立。 取k=4,得
p1p2p3=p3p4p5,不成立。再取k=3,将k导入p的式子中得,
p1p2=p4p5,成立。所以next[6]=3;
7、j=7时,k的取值为(1,7)的开区间,先取k=6,将k导入p
的式子中得,p1p2p3p4p5=p2p3p4p5p6,不成立。 再取k=5, 得 p1p2p3p4=p3p4p5p6 ,不成立。 再取k=4,得
p1p2p3=p4p5p6 ,成立。所以next[7]=4;
8、j=8时,k的取值为(1,8)的开区间, 先取k=7,将k导入
p的式子中得,p1p2p3p4p5p6=p2p3p4p5p6p7,不成立。 再 取k=6,得p1p2p3p4p5=p3p4p5p6p7,不成立。… 再取k=2, 得p1=p7,不成立。k再取值就超出范围了,所以next[8]不属
于第二种情况,那就是第三种了,即next[8]=1;
在这里插入图片描述

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
首先,KMP算法中的next函数用于匹配失败时进行跳转,nextval函数则是对于重复的最长前缀和最长后缀进行优化,以达到更快的匹配速度。 对于模式串"abcdabcdab",它的next函数可以如下计算: 1. 首先,next[0] = -1,next[1] = 0; 2. 以i=2为例,模式串中前缀"ab"和后缀"ab"完全匹配,因此next[2] = 1; 3. 以i=3为例,模式串中前缀"abc"和后缀"abc"完全匹配,因此next[3] = 2; 4. 以i=4为例,模式串中前缀"abcd"和后缀"abcd"完全匹配,因此next[4] = 3; 5. 以i=5为例,模式串中前缀"abcda"和后缀"abcda"完全匹配,因此next[5] = 4; 6. 以i=6为例,模式串中前缀"abcdab"和后缀"abcdab"完全匹配,因此next[6] = 5; 7. 以i=7为例,模式串中前缀"abcdabc"和后缀"abcdabc"完全匹配,因此next[7] = 6; 8. 以i=8为例,模式串中前缀"abcdabcd"和后缀"abcdabcd"完全匹配,因此next[8] = 7; 9. 以i=9为例,模式串中前缀"abcdabcda"和后缀"abcdabcda"不完全匹配,但是可以通过next[8]跳转到next[7],即next[9] = next[8] + 1 = 8; 10. 以i=10为例,模式串中前缀"abcdabcdab"和后缀"abcdabcdab"完全匹配,因此next[10] = 9。 因此,模式串"abcdabcdab"的next函数为-1,0,1,2,3,4,5,6,7,8,9。 接下来,我们可以通过next函数来计算nextval函数: 1. 首先,nextval[0] = -1,nextval[1] = 0; 2. 对于i=2,因为next[i] = 1,所以nextval[i] = next[i] = 1; 3. 对于i=3,因为next[i] = 2,所以nextval[i] = next[i] = 2; 4. 对于i=4,因为next[i] = 3,所以nextval[i] = next[i] = 3; 5. 对于i=5,因为next[i] = 4,所以nextval[i] = next[i] = 4; 6. 对于i=6,因为next[i] = 5,所以nextval[i] = next[i] = 5; 7. 对于i=7,因为next[i] = 6,所以nextval[i] = next[i] = 6; 8. 对于i=8,因为next[i] = 7,所以nextval[i] = next[i] = 7; 9. 对于i=9,因为next[i] = 8,所以nextval[i] = next[next[i]] = next[8] = 7; 10. 对于i=10,因为next[i] = 9,所以nextval[i] = next[next[i]] = next[9] = 8。 因此,模式串"abcdabcdab"的nextval函数为-1,0,1,2,3,4,5,6,7,8。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值