追逐影子的人,自己就是影子。 ——荷马
达达最近迷上了文学。
她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。
达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。
其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
注意:请使用 64 位整数进行输入输出、储存和计算。
输入格式
输入文件的第1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
第 2∼n+1 行:第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
输出格式
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
数据范围
2≤n≤100000,
2≤k≤9
1≤wi≤10^12
输入样例:
4 2
1
1
2
2
输出样例:
12
2
思路:k叉huffman树+堆
题目输入的是n,k,以及n个单词出现的次数,要将单词进行k进制数转换,
使得转换后没有一个单词是另一个单词的前缀,总单词编码树长度最短以及最长的单词长度最小
算法:我们可以根据每个单词的出现次数做成一个k叉huffman树,使得单词出现次数最少的在下面,
同时如果将k叉huffman树看成一个trie树,单词i的编码就是从根节点到叶节点i的路径各字符相连
因此等价于单词长度越长的次数越少,满足使得总长度最小
要使得最长的单词长度最短,只需要将huffman树节点变成pair类型的,first存值,second存该节点的深度
在合并的时候对于权值相同的节点优先考虑当前深度最小的进行合并;其中k叉huffman树的构造不
能直接依次选择堆中最小的k个权值,因为如果最后一轮循环堆的大小在2-(k-1)之间,
huffman树的根的子节点个数<k,这不是最优解:任意将一个深度最大的子节点变为树根子节点都会使得总权值*高度变小
所以可以添加一些额外的0节点,使得叶子节点个数n满足(n-1)%(k-1)=0
#include<iostream>
#include<queue>
#include<vector>
using namespace std;
using ll=long long;
using pll=pair<ll,ll>;//first存值,second存该节点的深度
int main()
{
int n,k;
cin>>n>>k;
priority_queue<pll,vector<pll>,greater<pll>> heap;
for(int i=0;i<n;i++){
ll x;
cin>>x;
heap.push({x,0});//初始深度都为1
}
while((n-1)%(k-1)!=0){//k叉huffman树使得(n-1)%(k-1)=0
heap.push({0,0});
n++;
}
ll res=0;//合并总代价
while(heap.size()>1){//构造huffman树
ll ans=0,depth=0;
for(int i=0;i<k;++i){
auto t=heap.top();
heap.pop();
ans+=t.first;//每一次的合并代价
depth=max(depth,t.second);//深度=所有节点深度最大
}
res+=ans;//
heap.push({ans,depth+1});//节点合并后使新节点深度+1
}
cout<<res<<endl<<heap.top().second;
return 0;
}