题干:
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。
达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1…t]。
其中,m 是字符串 Str2 的长度,Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
第2~n+1 行:第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
2≤n≤100000
2≤k≤9
思路:
题目巨长,总结一下就是我们要将《荷马史诗》中的单词重新编码,已知单词种类数和出现的次数(因为要重新编码所以不在意原长度),将每一个单词重新编码成一个k进制数,然后求编码后最短长度,这就类似Huffman编码。
因为是k进制数,所以每一位上最多编码k个单词(例如3进制可以用0、1、2表示),这样就是个k叉Huffman树(即一次合并k个值),又因为存在n%k!=0的情况,这种会导致最下层合并的节点多,上层合并的节点少而导致和增大,所以我们可以进行补零操作。
然后考虑最长字符串的最短长度,因为用了Huffman树,所以我们的最长字符串一般是最小的,但由于存在权值相同的点深度不同的情况,所以在这种情况下优先合并深度低的点。
#include <cstdio>
#include <cstring>
#include <cmath>
#include <queue>
#include <iostream>
#include <algorithm>
#define ll long long
using namespace std;
pair<ll,int>t;
priority_queue<pair<ll,int>,vector<pair<ll,int> >,greater<pair<ll,int> > >q;
ll ans=0,x;
int main()
{
int n,k;
scanf("%d%d",&n,&k);
for(int i=0;i<n;i++){
scanf("%lld",&x);
q.push({x,0});
}
while((n-1)%(k-1))
q.push({0,0}),n++;
while(q.size()>1){
ll sum=0;
int mx=0;
for(int i=0;i<k;i++){
sum+=q.top().first;
mx=max(mx,q.top().second);
q.pop();
}
ans+=sum;
//printf("%lld\n",ans);
q.push({sum,mx+1});
}
printf("%lld\n%d\n",ans,q.top().second);
return 0;
}