后缀自动机板子和一些用法

后缀自动姬

是什么?
博主不想写反正没人看
直接去hihocoder
概念1
算法2

模板

# include <bits/stdc++.h>
# define IL inline
# define RG register
# define Fill(a, b) memset(a, b, sizeof(a))
using namespace std;
typedef long long ll;

template <class Int>
IL void Input(RG Int &x){
    RG int z = 1; RG char c = getchar(); x = 0;
    for(; c < '0' || c > '9'; c = getchar()) z = c == '-' ? -1 : 1;
    for(; c >= '0' && c <= '9'; c = getchar()) x = (x << 1) + (x << 3) + (c ^ 48);
    x *= z;
}

const int maxn(2e6 + 5);

int n, trans[26][maxn], fa[maxn], len[maxn], tot = 1, last = 1;
char s[maxn];

IL void Extend(RG int c){
    RG int np = ++tot, p = last; last = np;
    len[np] = len[p] + 1;
    while(p && !trans[c][p]) trans[c][p] = np, p = fa[p];
    if(!p) fa[np] = 1;
    else{
        RG int q = trans[c][p];
        if(len[p] + 1 == len[q]) fa[np] = q;
        else{
            RG int nq = ++tot;
            len[nq] = len[p] + 1, fa[nq] = fa[q];
            for(RG int i = 0; i < 26; ++i) trans[i][nq] = trans[i][q];
            fa[q] = fa[np] = nq;
            while(p && trans[c][p] == q) trans[c][p] = nq, p = fa[p];
        }
    }
}

int main(RG int argc, RG char* argv[]){
    scanf(" %s", s), n = strlen(s);
    for(RG int i = 0; i < n; ++i) Extend(s[i] - 'a');
    return 0;
}

用法

一个串不同子串的个数

就是endpos(right)集合的大小和
就是ilen[i]len[fa[i]]

两个串的最长公共子串长度

一个串建立sam
另一个串匹配就好啦

for(RG int i = 0, nw = 1, cnt = 0; i < n; ++i){
    RG int c = s[i] - 'a';
    if(trans[c][nw]) ++cnt, nw = trans[c][nw];
    else{
        while(nw && !trans[c][nw]) nw = fa[nw];
        if(!nw) nw = 1, cnt = 0;
        else cnt = len[nw] + 1, nw = trans[c][nw];
    }
    ans = max(ans, cnt);
}

拓扑序的快速求法

len来个桶排序

for(RG int i = 1; i <= tot; ++i) ++t[len[i]];
for(RG int i = 1; i <= tot; ++i) t[i] += t[i - 1];
for(RG int i = 1; i <= tot; ++i) id[t[len[i]]--] = i;

多个串的最长公共子串

一个串建立sam
其它的串在上面匹配
可以类似DP的在拓扑序上转移

for(RG int i = 1; i <= tot; ++i) ++t[g[i] = len[i]];
for(RG int i = 1; i <= tot; ++i) t[i] += t[i - 1];
for(RG int i = 1; i <= tot; ++i) id[t[len[i]]--] = i;
while(scanf(" %s", s) != EOF){
    n = strlen(s);
    for(RG int i = 1; i <= tot; ++i) f[i] = 0;
    for(RG int i = 0, nw = 1, cnt = 0; i < n; ++i){
        RG int c = s[i] - 'a';
        if(trans[c][nw]) ++cnt, nw = trans[c][nw];
        else{
            while(nw && !trans[c][nw]) nw = fa[nw];
            if(!nw) nw = 1, cnt = 0;
            else cnt = len[nw] + 1, nw = trans[c][nw];
        }
        f[nw] = max(f[nw], cnt);
    }
    for(RG int i = tot; i; --i) f[fa[id[i]]] = max(f[fa[id[i]]], f[id[i]]);
    for(RG int i = 1; i <= tot; ++i) g[i] = min(g[i], f[i]);
}
for(RG int i = 1; i <= tot; ++i) ans = max(ans, g[i]);

某一字符串出现的次数

大概就是求出parent树上每个点的子树大小,就是这个点的endpos(right)集合的串的出现次数
然后搞一搞就好了

第k小子串

相同的不算

每条从起点开始的路径都是一个子串
那么就是求出第k小的路径,跑一遍就好了

相同的算多个

也就是一个endpos(right)集合内的串要算上出现次数
其它的基本和上面相似

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/oi_Konnyaku/article/details/79981140
上一篇Bzoj3555: [Ctsc2014]企鹅QQ
下一篇HDU4622: Reincarnation
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭