题目描述
追逐影子的人,自己就是影子。 ——荷马
达达最近迷上了文学。
她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wiwi。
达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m1≤t≤m,使得 Str1=Str2[1…t]。
其中,m 是字符串 Str2 的长度,Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。
输入格式
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
第2~n+1 行:第 i+1 行包含 1 个非负整数 wiwi,表示第 i 种单词的出现次数。
输出格式
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 sisi 的最短长度。
数据范围
2≤n≤1000002≤n≤100000
2≤k≤92≤k≤9
样例
输入样例:
4 2
1
1
2
2
输出样例:
12
2
思路:确保总长度最小==出现次数多的单词层数高,次数少的层数低占据的链长,一个单词不是另一个的前缀,对应着:所有单词的编码末尾都在叶子节点上;
k叉哈夫曼树:补加一些权重为0的数(n-1)%(k-1)==0;
每个节点对应的数字,向上一层贡献的长度为个数*1,层数+1;
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
ll n,k;
typedef pair<ll,int> pll;
priority_queue<pll,vector<pll>,greater<pll> >q;
int main(){
ios::sync_with_stdio(false);
cin>>n>>k;
//刚开始都是0层
for(int i=0;i<n;i++){
ll x;
cin>>x;
q.push(make_pair(x,0));
}
//建立第0层哈夫曼树
while((n-1)%(k-1)) q.push(make_pair(0,0)),n++;
ll res=0;//记录总权重
while(q.size()>1){ //当size==1,哈夫曼树建立到最顶层;
ll ss=0;
int cur1=0;
//统计上一小节哈夫曼数据
for(int i=0;i<k;i++){
pll temp=q.top();
q.pop();
ss+=temp.first;
cur1=max(cur1,temp.second);
}
res+=ss;
q.push(make_pair(ss,cur1+1));
}
cout<<res<<endl<<q.top().second<<endl;
return 0;
}