洛谷传送门
【题目分析】
这题目描述真是令人窒息。
3个条件的意思大概是这样:
(1).如果有单词作为现在正在填入的单词的后缀但并未填入,将花费n*n的代价。
(2).如果没有单词作为当前填入单词的后缀,代价为当前填入单词序号x
(3).如果所有作为该单词的后缀的单词之前都已经填入,那么代价为当前序号x-最后一个作为当前单词的后缀的单词的序号y。
读懂题以后这道题还是比较明显的贪心。第1个条件提示一定是先将所有作为后缀的单词填入,因为如果不这样填不管怎么样代价都小于n*n。
由于询问的是后缀,所以后缀相同其实等价于反串的前缀相同,所以倒着建立一个trie树。
这时问题转化为求一棵树的拓扑序,满足儿子与父亲的编号差的和最小,所以可以直接贪心来做,简单观察发现,对于某一刻,无论选哪个节点,总代价都会增大目前能扫到的第一个标记点的总量。
要使总代价最少,那么这次选的点一定要使以后增加的点最小.
所以记录一下每个点能看到的,以及这一个子树下分支总量,一定优先处理分支更小的子树。
【代码~】
#include<bits/stdc++.h>
using namespace std;
typedef pair<int,int> pll;
const int MAXN=5e5+10;
long long n,siz,ans;
char s[MAXN];
struct Trie{
int val;
int son[26];
}tr[MAXN];
int tot[MAXN],sum[MAXN];
vector<int> idx[MAXN];
void insert(char a[]){ //建立trie树
int len=strlen(a);
int last=0;
for(int i=len-1;i>=0;--i){ //后缀
int x=a[i]-'a';
if(!tr[last].son[x]){
tr[last].son[x]=++siz;
}
last=tr[last].son[x];
}
tr[last].val=1; //记录终止点
}
void dfs(int u,int fa){
if(tr[u].val) //是一个终止点
tot[fa]++,idx[fa].push_back(u),fa=u;
for(int i=0;i<='z'-'a';++i){
if(tr[u].son[i])
dfs(tr[u].son[i],fa);
}
sum[u]=tot[u];
int size=idx[u].size();
for(int i=0;i<size;++i){
sum[u]+=sum[idx[u][i]];//记录子树信息
}
}
void bfs(){
priority_queue<pll> q;
q.push(make_pair(0,0));
int now=1;
while(!q.empty()){
pair<int,int> u=q.top();
q.pop();
now=now+tot[u.second]-1;
ans+=now;
int size=idx[u.second].size();
for(int i=0;i<size;++i){
q.push(make_pair(-sum[idx[u.second][i]],idx[u.second][i]));//先找小的所以取相反数
}
}
}
int main(){
scanf("%d",&n);
for(int i=1;i<=n;++i){
scanf("%s",s);
insert(s);
}
dfs(0,0);
bfs();
cout<<ans;
return 0;
}