题意:给出一棵树,每个节点上有一个字符,问整棵树一共多少不同的串?
(保证叶子节点小于等于20)
难点1在于怎么统计到所有的子串,直接统计肯定是不行的,我们注意到叶子节点小于等于20,我们考虑将每个叶子节点作为根把树给提起来,然后定义这棵树的子串为从上到下的一个串(深度从浅到深),首先我们发现这样可以不考虑树上子串的复杂问题了(因为是有序的),其次我们发现这样之后包含了树上的所有子串(虽然我不知道为什么。)
我们统计20棵树的不同子串只需要把它们建到一个自动机上就行了。
要这样做要满足这两个条件:
1. 后缀自动机支持字符串分叉。
2. 后缀自动机支持多串匹配。
一开始我比较怀疑这两个结论不敢乱作,不过事实证明这两个都是可以的,所以这道题剩下就简单了。
#include <iostream>
#include <cstring>
#include <cstdlib>
#include <string>
#include <cstdio>
#include <algorithm>
#include <cmath>
#include <ctime>
using namespace std;
struct node{int to;int next;
};node bian[500010];
int tot = 1,step[8000010],son[8000010][11],pre[8000010],c,A[500010],n;
int size = 0,first[500010],a,b,line[500010];
long long Ans = 0;
void inser(int x,int y) {
bian[++size].to=y;
bian[size].next=first[x];
first[x]=size;
}
int insert(int now,int x) {
int np = ++ tot;
step[np] = step[now] + 1;
while(son[now][x] == 0 && now != 0) son[now][x] = np,now = pre[now];
if(now == 0) pre[np] = 1;
else {
int q = son[now][x];
if(step[q] == step[now] + 1) pre[np] = q;
else
{
int nq = ++ tot;
step[nq] = step[now] + 1;
for(int i = 0;i < c;i ++) son[nq][i] = son[q][i];
pre[nq] = pre[q];
pre[q] = pre[np] = nq;
while(son[now][x] == q) son[now][x] = nq,now = pre[now];
}
}
return np;
}
void dfs(int x,int Anc,int last) {
int next = insert(last,A[x]);
for(int u = first[x];u;u = bian[u].next)
if(bian[u].to != Anc)
dfs(bian[u].to,x,next);
}
int main() {
scanf("%d%d",&n,&c);
for(int i = 1;i <= n;i ++) scanf("%d",&A[i]);
for(int i = 1;i <n;i ++) {
scanf("%d%d",&a,&b);
inser(a,b);
inser(b,a);
line[a] ++;
line[b] ++;
}
for(int i = 1;i <= n;i ++)
if(line[i] == 1)
dfs(i,0,1);
for(int i = 1;i <= tot;i ++) Ans += (long long)(step[i] - step[pre[i]]);
printf("%I64d",Ans);
return 0;
}