考虑贪心,第一个条件一定不去满足,我们要考虑如何安排顺序让答案最优
举一个栗子来看
ab
xyab
yab
cb
很明显我们不能先取xyab和yab , 因为ab是他们的后缀
我们考虑先取ab , 其次显然取yab比xyab优 , 最后取cb
这样答案是1+(2-1) + (3-2)+4
但如果我们先取cb , 再取ab,yab,xyab
这样答案就是1+2+(3-2)+(4-3)
于是我们知道,首先 , 如果一个串是另一个的后缀 , 我们一定得先把它放在前面
其次, 我们记siz[b] 为已b结尾的个数 , 我们要先取cb因为siz[cb]<siz[ab]
因为这样ab的值只会多一个siz[cb] , 而cb的值少了一个siz[ab]
于是我们将后缀转换为前缀 , 建好trie过后 ,将每个有值的点向它到根节点遇到的第一个有值的节点建边
在新图中 dfs一遍出来siz ,将儿子按siz排序, 统计答案就可以了
#include<bits/stdc++.h>
#define N 500150
#define LL long long
using namespace std;
int n,ch[N][26],val[N],sign=1,siz[N];
vector<int> son[N]; int id[N],dfn; LL ans;
void Insert(string s){
int len = s.length(),now=1;
for(int i=len-1;i>=0;i--){
int pos = s[i] - 'a';
if(!ch[now][pos]) ch[now][pos] = ++sign;
now = ch[now][pos];
} val[now]++;
}
void build(int fa,int u){
for(int i=0;i<26;i++){
int pos = ch[u][i]; if(!pos) continue;
if(!val[pos]) build(fa,pos);
else son[fa].push_back(pos),build(pos,pos);
}
}
bool cmp(int x,int y){return siz[x]<siz[y];}
void dfs(int u){
siz[u]=1; int x = son[u].size();
for(int i=0;i<x;i++){
int t=son[u][i]; dfs(t); siz[u] += siz[t];
} sort(son[u].begin(),son[u].end(),cmp);
}
void Solve(int u,int f){
id[u] = ++dfn; int x = son[u].size();
for(int i=0;i<x;i++){
int t=son[u][i]; Solve(t,u);
} ans += (LL)id[u] - id[f];
}
int main(){
scanf("%d",&n); for(int i=1;i<=n;i++){
string s; cin>>s; Insert(s);
} build(1,1); dfs(1); Solve(1,1);
printf("%lld",ans); return 0;
}