洛谷 P2168 [NOI2015] 荷马史诗

月半流苏

已于 2022-09-28 20:30:21 修改

阅读量610

点赞数 4

分类专栏：数据结构文章标签：霍夫曼树贪心算法

于 2022-09-17 22:02:54 首次发布

本文链接：https://blog.csdn.net/AmyLiu_1020/article/details/126864189

版权

数据结构专栏收录该内容

21 篇文章 0 订阅

订阅专栏

PS：如果读过题了可以跳过题目描述直接到题解部分

提交链接：洛谷 P2168 [NOI2015] 荷马史诗

题目

题目背景

追逐影子的人，自己就是影子 —— 荷马

题目描述

Allison 最近迷上了文学。她喜欢在一个慵懒的午后，细细地品上一杯卡布奇诺，静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词，从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 w[i]。Allison 想要用 k 进制串 s[i] 来替换第 i 种单词，使得其满足如下要求：

对于任意的 1≤i, j≤n ，i≠j ，都有：s[i] 不是 s[j] 的前缀。

现在 Allison 想要知道，如何选择 s[i]，才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下，Allison 还想知道最长的 s[i] 的最短长度是多少？

一个字符串被称为 k 进制字符串，当且仅当它的每个字符是 0 到 k-1 之间（包括 0 和 k-1 ）的整数。

字符串 str1 被称为字符串 str2 的前缀，当且仅当：存在 1≤t≤m ，使得 str1 = str2[1..t]。其中，m 是字符串 str2 的长度，str2[1..t] 表示 str2 的前 t 个字符组成的字符串。

输入格式

输入的第 1 行包含 2 个正整数 n, k ，中间用单个空格隔开，表示共有 n 种单词，需要使用 k 进制字符串进行替换。

接下来 n 行，第 i + 1 行包含 1 个非负整数 w[i]，表示第 i 种单词的出现次数。

输出格式

输出包括 2 行。

第 1 行输出 1 个整数，为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数，为保证最短总长度的情况下，最长字符串 s[i] 的最短长度。

样例1

样例输入1

4 2
1
1
2
2

样例输出1

12
2

样例2

样例输入2

6 3
1
1
3
3
9
9

样例输出2

36
3

提示

样例解释

样例 1 解释

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案：令 00(2) 替换第 1 种单词， 01(2) 替换第 2 种单词， 10(2) 替换第 3 种单词，11(2) 替换第 4 种单词。在这种方案下，编码以后的最短长度为：

1 × 2 + 1 × 2 + 2 × 2 + 2 × 2 = 12

最长字符串 s[i] 的长度为 2 。

一种非最优方案：令 000(2) 替换第 1 种单词，001(2) 替换第 2 种单词，01(2) 替换第 3 种单词，1(2) 替换第 4 种单词。在这种方案下，编码以后的最短长度为：

1 × 3 + 1 × 3 + 2 × 2 + 2 × 1 = 12

最长字符串 s[i] 的长度为 3 。与最优方案相比，文章的长度相同，但是最长字符串的长度更长一些。

样例 2 解释

一种最优方案：令 000(3) 替换第 1 种单词，001(3) 替换第 2 种单词，01(3) 替换第 3 种单词， 02(3) 替换第 4 种单词， 1(3) 替换第 5 种单词， 2(3) 替换第 6 种单词。

数据规模与约定

所有测试数据的范围和特点如下表所示（所有数据均满足 0 < w[i]≤10^11）：

测试点编号	n 的规模	k 的规模	备注
1	n=3	k=2
2	n=5	k=2
3	n=16	k=2	所有 w[i] 均相等
4	n=1 000	k=2	w[i]在取值范围内均匀随机
5	n=1 000	k=2
6	n=100 000	k=2
7	n=100 000	k=2	所有 w[i] 均相等
8	n=100 000	k=2
9	n=7	k=3
10	n=16	k=3	所有 w[i] 均相等
11	n=1 001	k=3	所有 w[i] 均相等
12	n=99 999	k=4	所有 w[i] 均相等
13	n=100 000	k=4
14	n=100 000	k=4
15	n=1 000	k=5
16	n=100 000	k=7	w[i]在取值范围内均匀随机
17	n=100 000	k=7
18	n=100 000	k=8	w[i]在取值范围内均匀随机
19	n=100 000	k=9
20	n=100 000	k=9

提示

选手请注意使用 64 位整数进行输入输出、存储和计算。

评分方式

对于每个测试点：

若输出文件的第 1 行正确，得到该测试点 40% 的分数；

若输出文件完全正确，得到该测试点 100% 的分数。

题解

哈夫曼编码树

详见我之前发过的文章

未来计算 3219 未来算算 1260 Huffman编码树

就题调整

对于这道题而言，因为可以用不同进制的数，所以也就不一定要用左子节点和右子节点，而可以直接用son数组（我偷懒写的s），操作基本上是一样的，就取权值最小的前k个，合成成一棵子树。

取最小的前k个，我用的是手写堆排序，不想手写的其实也可以用其他函数代替。

但需要注意的是，直接像二进制一样建树可能会出现上层节点不到k个的情况，这个时候其实并不是最优，所以需要把下面的节点往上面挪。我看其他博主有用空节点占位的方法，但我是直接计算合并的第一棵树应该合并多少个节点，公式如下：node=n%(k-1)（二进制的时候不需要计算，要提前进行特判），但当node=1的时候，相当于只合并一个节点，这就是没有必要的，就可以直接合并k个节点。

另外，题目不仅要求最后要总长度最短，还要求要最长的字符串长度最短，即编码树的树高尽可能矮。因此在节点信息中，我加入了子树深度来对排序进行影响，在权值相同的情况下，将子树深度较小的排在前面。

最后，从根节点进行深搜，更新节点到根节点的距离（即字符串长度）和最远距离（即最长的字符串长度）。

代码实现

我的代码可能不太简洁，但反正洛谷是过了的。

//洛谷 P2168 [NOI2015] 荷马史诗 
#include<iostream>
#include<cstdio>
using namespace std;
long long n;
int k;
int a[110000];//堆 保存子树节点序号
int cnt;
int t;
unsigned long long ans;
unsigned long long maxx;

struct node{
	unsigned long long w;//节点权值
	unsigned long long h;//该节点与根节点的距离
	int s[11];
	unsigned long long d;//子树深度
}w[440000];

//堆增加节点
void insert(int x){
	int p=++cnt;
	a[p]=x;
	while(p!=1&&(w[a[p/2]].w>w[a[p]].w||(w[a[p/2]].w>w[a[p]].w&&w[a[p/2]].d>w[a[p]].d))){
		swap(a[p/2],a[p]);
		p/=2;
	}
}

//堆弹出
void pop(){
	swap(a[cnt],a[1]);
	--cnt;
	int p=1;
	int k=1;
	while(1){
		if((p<<1)<=cnt&&(w[a[k]].w>w[a[(p<<1)]].w||(w[a[k]].w==w[a[(p<<1)]].w&&w[a[k]].d>w[a[(p<<1)]].d))){
			k=(p<<1);
		}
		if(((p<<1)|1)<=cnt&&(w[a[k]].w>w[a[(p<<1)|1]].w||(w[a[k]].w==w[a[(p<<1)|1]].w&&w[a[k]].d>w[a[(p<<1)|1]].d))){
			k=(p<<1|1);
		}
		if(k==p){
			break;
		}
		swap(a[k],a[p]);
		p=k;
	}
}

//建哈夫曼编码树
void build(int x){
	++t;
	for(int i=1;i<=x&&cnt;++i){
		w[t].w+=w[a[1]].w;
		w[t].s[i]=a[1];
		w[t].d=max(w[t].d,w[a[1]].d+1);
		pop();
	}
}

//深搜更新与根节点的距离
void dfs(int x,unsigned long long h){
	w[x].h=h;
	for(int i=1;i<=k;++i){
		if(w[x].s[i]){
			dfs(w[x].s[i],h+1);
		}
	}
	if(h>maxx){
		maxx=h;
	}
}

int main(){
	scanf("%lld%d",&n,&k);
	for(int i=1;i<=n;++i){
		scanf("%lld",&w[i].w);
		insert(i);
		w[i].d=1;
	}
	t=cnt;
	if(cnt!=1){
		build(k==2?2:(n%(k-1)==1?k:n%(k-1)));//第一棵子树需计算合并节点数
	}
	insert(t);
	while(cnt!=1){
		build(k);
		insert(t);
	}
	dfs(t,0);
	for(int i=1;i<=n;++i){
		ans+=w[i].w*w[i].h;
	}
	printf("%lld\n%lld\n",ans,maxx);
	return 0;
}

月半流苏

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
洛谷 P2168 [NOI2015] 荷马史诗

Allison最近迷上了文学。她喜欢在一个慵懒的午后，细细地品上一杯卡布奇诺，静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，Allison想通过一种编码方式使得它变得短一些。一部《荷马史诗》中有 n种不同的单词，从 1到 n进行编号。其中第 i种单词出现的总次数为 w[i]。Allison 想要用k进制串s[i]来替换第i种单词，使得其满足如下要求：对于任意的1≤i, j≤n，i≠j，都有s[i]不是s[i]的前缀。
复制链接

扫一扫