可以读取所有子串的自动机
每个节点代表一系列后缀 (abcd,bcd…)
每个节点slink发生质变。endpos集合发生变化
slink树 在区分前缀节点后 可以计算每个节点所代表的endpos子串出现次数(不同子树endpos交集为空,同一子树中深度最低的节点的endpos为其所有子节点endpos集合加上有可能出现的前缀。)
trans函数本身构成DAG结构。在每个字符有所带权值情况下,可以用于求一字符串所有不同子串(相同也可以先计算每个节点出现次数)的权值和。 也可以求出每个节点所代表的有效字符串种类
endpos相同的所有子串都会走到同一点。
增量法构造,每新增一个字符,相当于多i+1个后缀,
考虑这些后缀的endpos是否都为z(最长那个)。
我们沿着slink_path(u)一直走,出现sam[u].trans[c]!=-1时说明发生endpos集合变化(即此后缀在之前出现过)
这里又分两种情况
1)对新增的串对状态x的endpos无影响
2)产生影响,例:abcxabcxbc+x时 abcx 的endpos 由abcx,bcx,cx,x变为abcx+bcx的endpos。所以需要拆点。
(待补)
每种长度子串出现最多次数?
dfs序?
DAG?
LCP?
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int SZ = 26;
const int maxn = 1e6+5;
char s[maxn];
/*
一切和节点个数有关的数组都要开字符串长度的两倍
*/
struct SAM {
int trans[maxn<<1][SZ],slink[maxn<<1],mi[maxn<<1],mx[maxn<<1],tot;
int dp[maxn<<1];
int newnode(int _mi,int _mx,int *tran,int _slink) {
mi[tot]=_mi; mx[tot]=_mx;
slink[tot]=_slink;
tran?memcpy(trans[tot],tran,SZ*sizeof(int)):memset(trans[tot],-1,SZ*sizeof(int));
return tot++;
}
int init() {
tot=0;
return newnode(0,0,0,-1);
}
int append(int ch,int u) {
int c=s[ch]-'a';
int z=newnode(-1,mx[u]+1,0,-1);
int v=u;
while(v!=-1&&trans[v][c]==-1) {
trans[v][c]=z;
v=slink[v];
}
if(v==-1) {
slink[z]=0;
mi[z]=1;
} else {
int x=trans[v][c];
if(mx[v]+1==mx[x]) {
mi[z]=mx[x]+1;
slink[z]=x;
} else {
int y=newnode(-1,mx[v]+1,trans[x],slink[x]);
slink[x]=y; slink[z]=y;
mi[x]=mx[y]+1; mi[z]=mx[y]+1;
while(v!=-1&&trans[v][c]==x) {
trans[v][c]=y;
v=slink[v];
}
mi[y]=mx[slink[y]]+1;
}
}
return z;
}
}sam;
int main() {
scanf("%s",s+1);
int n=strlen(s+1),u=sam.init();
for(int i=1;i<=n;i++) {
u=sam.append(i,u);
}
return 0;
}