Description
追逐影子的人,自己就是影子。 ——荷马
Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
Input
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
Output
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
Sample Input
4 2
1
1
2
2
1
1
2
2
Sample Output
12
2
2
HINT
用 X(k) 表示 X 是以 k 进制表示的字符串。
一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
1×2+1×2+2×2+2×2=12
最长字符串 si 的长度为 2。
一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
1×3+1×3+2×2+2×1=12
最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。
对于所有数据,保证 2≤n≤100000,2≤k≤9。
选手请注意使用 64 位整数进行输入输出、存储和计算。
Source
~~~~~~~~~~~~~~~~~~~~~~~~~~~~哈夫曼编码+贪心~
哈夫曼编码是将n个数编为具有二义性的编码的算法,具体实现(以二进制编码为例):
先将所有元素排序。每次从中取出最小的两个,作为两个节点,建立一个他们的父节点,val为这两点之和,然后把这个父节点放入队伍中,重复以上操作知道所有点都被取出。我们就建立了一棵二叉树。我们设左叉为0,右叉为1,那么从根结点到每一个叶子节点就是一个编码,这些编码具有二义性,就是哈夫曼编码。
那么k叉树就代表了k进制的编码。
但是k进制的哈夫曼编码需要注意:每次取出k个点,放入1个点,所以n-1应该是k-1的倍数。为了满足这条性质,当(n-1)%(k-1)!=0时我们需要在其中添加k-1-((n-1)%(k-1))个权值为0的点。
所以我们用堆维护点。
但是又注意到题目要求编码的长度最小,所以我们同时记录一个长度len,在val相同时贪心地取len最小的点。
(如果上面的几段没有看懂,可以看一下http://blog.csdn.net/Quack_quack/article/details/46958413,我就是看这个学会的~)
注意:
1.u.val>v.val才是小根堆;
2.开long long.
#include<cstdio>
#include<iostream>
#include<queue>
using namespace std;
#define ll long long
ll n,k,now,x,val,len,ans;
struct node{
ll val,len;
};
priority_queue<node> q;
ll read()
{
ll x=0,f=1;char ch=getchar();
while(ch<'0' || ch>'9') {if(ch=='-') f=-1;ch=getchar();}
while(ch>='0' && ch<='9') {x=(x<<1)+(x<<3)+ch-'0';ch=getchar();}
return x*f;
}
bool operator < (node u,node v)
{
return u.val==v.val ? u.len>v.len:u.val>v.val;
}
int main()
{
n=read();k=read();now=n;
for(int i=1;i<=n;i++) x=read(),q.push((node){x,0});
if((n-1)%(k-1)) for(int i=k-1-((n-1)%(k-1));i;i--) q.push((node){0,0}),now++;
while(now>1)
{
val=len=0;
for(int i=1;i<=k;i++)
{
len=max(q.top().len,len);
val+=q.top().val;ans+=q.top().val;q.pop();
}
q.push((node){val,len+1});
now-=k-1;
}
printf("%lld\n%lld",ans,q.top().len);
return 0;
}