后缀自动机

最新推荐文章于 2020-08-19 23:07:48 发布

_Jyq

最新推荐文章于 2020-08-19 23:07:48 发布

阅读量199

点赞数

分类专栏：算法学习 acm

本文链接：https://blog.csdn.net/qq_43914084/article/details/107145021

版权

acm 同时被 2 个专栏收录

78 篇文章 0 订阅

订阅专栏

算法学习

14 篇文章 0 订阅

订阅专栏

可以读取所有子串的自动机
每个节点代表一系列后缀 (abcd,bcd…)
每个节点slink发生质变。endpos集合发生变化
slink树在区分前缀节点后可以计算每个节点所代表的endpos子串出现次数(不同子树endpos交集为空，同一子树中深度最低的节点的endpos为其所有子节点endpos集合加上有可能出现的前缀。)

trans函数本身构成DAG结构。在每个字符有所带权值情况下，可以用于求一字符串所有不同子串(相同也可以先计算每个节点出现次数)的权值和。也可以求出每个节点所代表的有效字符串种类

endpos相同的所有子串都会走到同一点。
增量法构造，每新增一个字符，相当于多i+1个后缀，
考虑这些后缀的endpos是否都为z(最长那个)。
我们沿着slink_path（u）一直走，出现sam[u].trans[c]!=-1时说明发生endpos集合变化（即此后缀在之前出现过）
这里又分两种情况
1）对新增的串对状态x的endpos无影响
2）产生影响，例：abcxabcxbc+x时 abcx 的endpos 由abcx,bcx,cx,x变为abcx+bcx的endpos。所以需要拆点。
（待补）
每种长度子串出现最多次数?
dfs序？
DAG？
LCP？

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int SZ = 26;
const int maxn = 1e6+5;

char s[maxn];
/*
一切和节点个数有关的数组都要开字符串长度的两倍
*/
struct SAM {
    int trans[maxn<<1][SZ],slink[maxn<<1],mi[maxn<<1],mx[maxn<<1],tot;    
    int dp[maxn<<1];
    int newnode(int _mi,int _mx,int *tran,int _slink) {
        mi[tot]=_mi;        mx[tot]=_mx;
        slink[tot]=_slink;
        tran?memcpy(trans[tot],tran,SZ*sizeof(int)):memset(trans[tot],-1,SZ*sizeof(int));
        return tot++;
    }
    int init() {
        tot=0;
        return newnode(0,0,0,-1);
    }
    int append(int ch,int u) {
        int c=s[ch]-'a';
        int z=newnode(-1,mx[u]+1,0,-1);
        int v=u;
        while(v!=-1&&trans[v][c]==-1) {
            trans[v][c]=z;
            v=slink[v];
        }
        if(v==-1) {
            slink[z]=0;
            mi[z]=1;
        } else {
            int x=trans[v][c];
            if(mx[v]+1==mx[x]) {
                mi[z]=mx[x]+1;
                slink[z]=x;
            } else {
                int y=newnode(-1,mx[v]+1,trans[x],slink[x]);
                slink[x]=y;     slink[z]=y;
                mi[x]=mx[y]+1;  mi[z]=mx[y]+1;
               
                
                while(v!=-1&&trans[v][c]==x) {
                    trans[v][c]=y;
                    v=slink[v];
                }               
                mi[y]=mx[slink[y]]+1;
            }
        }
        return z;
    }
}sam;

int main() {
    scanf("%s",s+1);
    int n=strlen(s+1),u=sam.init();
    for(int i=1;i<=n;i++) {
        u=sam.append(i,u);
    }
    

    return 0;
}