作者介绍
我是长春理工大学计算机研0小棠学姐,今天为大家带来手算next数组的方法。
KMP
KMP(Knuth-Morris-Pratt)算法是一种高效的字符串匹配算法,它可以在一个文本字符串S内查找一个词W的出现位置。KMP算法的核心在于,当出现字符不匹配时,它利用已经部分匹配这个事实来避免从头开始比较。这通过预处理词W来构建一个“部分匹配表”或“next数组”来实现。
next数组的定义
next数组(也称为π表或失败函数)是一个整数数组,用于存储词W中每个位置之前的子串中,最长相等前后缀的长度(不包括自身)。
next数组的构建
构建next数组的基本步骤如下:
- 初始化
next[0] = -1
(或0,具体取决于实现,但-1在算法逻辑上更直观,因为它表示没有前缀)。 - 假设
next[j]
已经计算好(对于所有j < i
),现在计算next[i]
。 - 初始化
k = next[i-1]
(即前一个位置的next值)。 - 当
k != -1
(或0,取决于初始化)且W[k] != W[i-1]
时,更新k = next[k]
(即回溯到更前面的前缀)。 - 如果
W[k] == W[i-1]
,则next[i] = k + 1
。 - 如果找不到这样的k(即
k == -1
且i > 0
),则next[i] = 0
(或对于i=0
,next[0] = -1
)。
next数组的手算示例
假设词W为"ABCDABD":
next[0] = -1
(或0,这里我们使用-1)- 对于
i=1
,没有前缀,所以next[1] = 0
- 对于
i=2
,前缀"A"没有相等的前后缀,next[2] = 0
- 对于
i=3
,前缀"AB"没有相等的前后缀,next[3] = 0
- 对于
i=4
,前缀"ABC"没有相等的前后缀,next[4] = 0
- 对于
i=5
,前缀"ABCD"没有相等的前后缀,next[5] = 0
- 对于
i=6
,前缀"ABCDA"的最长相等前后缀是"A",next[6] = 1
- 对于
i=7
,前缀"ABCDAB"的最长相等前后缀是"AB",next[7] = 2
因此,next数组为[-1, 0, 0, 0, 0, 0, 1, 2]
(注意,这取决于你的实现,有时next数组的第一个元素是0,而不是-1)。
注意
- 在实际应用中,根据具体实现,next数组的第一个元素可能是0或-1。
- KMP算法的关键在于,当文本S和词W在某个位置不匹配时,不是简单地将W向右移动一个位置,而是根据next数组决定W应该向右移动多少位。
联系方式
如想要报考长春理工大学计算机专业的准研究生可联系我179+234+8035
也可直接加25长春理工大学计算机和人工智能专业考研群讨论