后缀自动姬
是什么?
博主不想写反正没人看
直接去
hihocoder
h
i
h
o
c
o
d
e
r
概念1
算法2
模板
# include <bits/stdc++.h>
# define IL inline
# define RG register
# define Fill(a, b) memset(a, b, sizeof(a))
using namespace std;
typedef long long ll;
template <class Int>
IL void Input(RG Int &x){
RG int z = 1; RG char c = getchar(); x = 0;
for(; c < '0' || c > '9'; c = getchar()) z = c == '-' ? -1 : 1;
for(; c >= '0' && c <= '9'; c = getchar()) x = (x << 1) + (x << 3) + (c ^ 48);
x *= z;
}
const int maxn(2e6 + 5);
int n, trans[26][maxn], fa[maxn], len[maxn], tot = 1, last = 1;
char s[maxn];
IL void Extend(RG int c){
RG int np = ++tot, p = last; last = np;
len[np] = len[p] + 1;
while(p && !trans[c][p]) trans[c][p] = np, p = fa[p];
if(!p) fa[np] = 1;
else{
RG int q = trans[c][p];
if(len[p] + 1 == len[q]) fa[np] = q;
else{
RG int nq = ++tot;
len[nq] = len[p] + 1, fa[nq] = fa[q];
for(RG int i = 0; i < 26; ++i) trans[i][nq] = trans[i][q];
fa[q] = fa[np] = nq;
while(p && trans[c][p] == q) trans[c][p] = nq, p = fa[p];
}
}
}
int main(RG int argc, RG char* argv[]){
scanf(" %s", s), n = strlen(s);
for(RG int i = 0; i < n; ++i) Extend(s[i] - 'a');
return 0;
}
用法
一个串不同子串的个数
就是
endpos(right)
e
n
d
p
o
s
(
r
i
g
h
t
)
集合的大小和
就是
∑ilen[i]−len[fa[i]]
∑
i
l
e
n
[
i
]
−
l
e
n
[
f
a
[
i
]
]
两个串的最长公共子串长度
一个串建立
sam
s
a
m
另一个串匹配就好啦
for(RG int i = 0, nw = 1, cnt = 0; i < n; ++i){
RG int c = s[i] - 'a';
if(trans[c][nw]) ++cnt, nw = trans[c][nw];
else{
while(nw && !trans[c][nw]) nw = fa[nw];
if(!nw) nw = 1, cnt = 0;
else cnt = len[nw] + 1, nw = trans[c][nw];
}
ans = max(ans, cnt);
}
拓扑序的快速求法
对 len l e n 来个桶排序
for(RG int i = 1; i <= tot; ++i) ++t[len[i]];
for(RG int i = 1; i <= tot; ++i) t[i] += t[i - 1];
for(RG int i = 1; i <= tot; ++i) id[t[len[i]]--] = i;
多个串的最长公共子串
一个串建立
sam
s
a
m
其它的串在上面匹配
可以类似
DP
D
P
的在拓扑序上转移
for(RG int i = 1; i <= tot; ++i) ++t[g[i] = len[i]];
for(RG int i = 1; i <= tot; ++i) t[i] += t[i - 1];
for(RG int i = 1; i <= tot; ++i) id[t[len[i]]--] = i;
while(scanf(" %s", s) != EOF){
n = strlen(s);
for(RG int i = 1; i <= tot; ++i) f[i] = 0;
for(RG int i = 0, nw = 1, cnt = 0; i < n; ++i){
RG int c = s[i] - 'a';
if(trans[c][nw]) ++cnt, nw = trans[c][nw];
else{
while(nw && !trans[c][nw]) nw = fa[nw];
if(!nw) nw = 1, cnt = 0;
else cnt = len[nw] + 1, nw = trans[c][nw];
}
f[nw] = max(f[nw], cnt);
}
for(RG int i = tot; i; --i) f[fa[id[i]]] = max(f[fa[id[i]]], f[id[i]]);
for(RG int i = 1; i <= tot; ++i) g[i] = min(g[i], f[i]);
}
for(RG int i = 1; i <= tot; ++i) ans = max(ans, g[i]);
某一字符串出现的次数
大概就是求出
parent
p
a
r
e
n
t
树上每个点的子树大小,就是这个点的
endpos(right)
e
n
d
p
o
s
(
r
i
g
h
t
)
集合的串的出现次数
然后搞一搞就好了
第k小子串
相同的不算
每条从起点开始的路径都是一个子串
那么就是求出第
k
k
小的路径,跑一遍就好了
相同的算多个
也就是一个集合内的串要算上出现次数
其它的基本和上面相似