拓展KMP
模板问题
给出两个字符串匹配串 s , 模式串 p
请输出 s 的每一个后缀与 p 的最长公共前缀
核心:由已知的匹配,求出当前已知的最长匹配位置
exkmp[]
:表示模式串的每个后缀与模式串最长匹配长度
extend[]
:表示匹配串的后缀与模式串的最长匹配长度
利用kmp
的思想,用已得到的信息推出下一位
EXtend[]
若已得到 e x t e n d [ i ] ( 1 ≤ i ≤ k ) extend[i](1\leq i \leq k) extend[i](1≤i≤k)
p
:为最长的已知匹配长度,即为
m
a
x
(
i
+
e
x
t
e
n
d
[
i
]
−
1
)
(
1
≤
i
≤
k
)
max(i+extend[i]-1)(1\leq i \leq k)
max(i+extend[i]−1)(1≤i≤k)
p0
:取到最长匹配长度的位置
k+1
:当前匹配位置
L
:exkmp[b]
k + L < p k+L< p k+L<p
即该点的最长匹配长度小于已知最长匹配长度
[l1,r1]
:[1,exkmp[b]]
[l2,r2]
:[k-p0+2,k-p0+1+exkmp[b]]
显然,红线、绿线、蓝线相等
那么, e x t e n d [ k + 1 ] = e x k m p [ b ] extend[k+1]=exkmp[b] extend[k+1]=exkmp[b]
if (i + exkmp[i + 1 - p0] < extend[p0] + p0)
// i相当于k+1,exkmp[i+1-p0] = exkmp[k+2-p0] = L
// 相当于 k + 1 + L < p0 + extend[p0] -> k + L < p0 + extend[p0] -1
extend[i] = exkmp[i + 1 - p0];
// extend[k+1] = L
k + L ≥ p k+L \ge p k+L≥p
即该点的最长匹配长度达到已知最长匹配长度
x
:(p,k+L]
s1
:[k+1,p]
s2
:[1,p-k]
s3
:[k-p0+2,p-p0+2]
显然,s1
,s2
,s3
相等
从p[p-k+1]
和s[p+1]
开始暴力匹配
now = extend[p0] + p0 - i + 1;
// p = extend[p0]+ p0 -1 ; i = k + 1
// now = p - k + 1
now = max(now, 1);
//防止特殊情况:k + 1 > p
while (now <= max_len && i - 1 + now <= len && p[now] == s[i - 1 + now]) now++;
//从p[p-k+1]和s[p+1]开始暴力匹配
extend[i] = now - 1;
//now为当前失配位置-1 即为匹配长度
p0 = i;
//更新p0
Exkmp[]
形如kmp
的next[]
数组
即为 自己配自己,自己的真后缀与自己最长匹配长度(第一位即本身)
exkmp[1] = max_len;
//第一位即本身
register int now = 1; //第二位开始暴力匹配
while (now + 1 <= max_len && p[now] == p[now + 1]) now++;
exkmp[2] = now - 1;
int p0 = 2;
for (int i = 3; i <= max_len; i++) {//重复拓展kmp即可
if (i + exkmp[i + 1 - p0] < exkmp[p0] + p0)
exkmp[i] = exkmp[i + 1 - p0];
else {
now = exkmp[p0] + p0 - i + 1;
now = max(now, 1);
while (i - 1 + now <= max_len && p[now] == p[i - 1 + now])
now++;
exkmp[i] = now - 1;
p0 = i;
}
}