AcWing 148. 合并果子 + 荷马史诗(Huffman树问题 + 堆)

合并果子–二叉Huffman树

题目描述

在一个果园里,达达已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。
达达决定把所有的果子合成一堆。
每一次合并,达达可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。
可以看出,所有的果子经过n-1次合并之后,就只剩下一堆了。
达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。
因为还要花大力气把这些果子搬回家,所以达达在合并果子时要尽可能地节省体力。
假定每个果子重量都为1,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使达达耗费的体力最少,并输出这个最小的体力耗费值。
例如有3种果子,数目依次为1,2,9。
可以先将1、2堆合并,新堆数目为3,耗费体力为3。
接着,将新堆与原先的第三堆合并,又得到新的堆,数目为12,耗费体力为12。
所以达达总共耗费体力=3+12=15。
可以证明15为最小的体力耗费值。
输入格式
输入包括两行,第一行是一个整数n,表示果子的种类数。
第二行包含n个整数,用空格分隔,第i个整数ai是第i种果子的数目。
输出格式
输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。
输入数据保证这个值小于231。
数据范围
1≤n≤10000,
1≤ai≤20000
输入样例:
3
1 2 9
输出样例:
15

题解

  1. 可以知道整个合并过程就是一个树的过程。可以证明:合并总体力就是各叶子结点到根节点的距离*叶子结点的值 这样, 当最小的两个点在树的叶子结点并且互为兄弟节点时,总和最小。
  2. 可以用一个小顶堆维护这个过程,先取出最小的两个点,算出这两个点的和,再加入到堆中。

代码

#include <iostream>
#include <queue>

using namespace std;

int main()
{
    int n;
    cin >> n;
    int x;
    priority_queue<int, vector<int>, greater<int>> heap;
    for(int i = 0; i < n; i++)
    {
        cin >> x;
        heap.push(x);
    }
    
    int res = 0;
    while(heap.size() > 1)
    {
        int a = heap.top();
        heap.pop();
        int b  = heap.top();
        heap.pop();
        res += a + b;
        heap.push(a + b);
    }
    
    cout << res << endl;
    
    return 0;
}

荷马史诗 – K叉Huffman树

题目描述

追逐影子的人,自己就是影子。 ——荷马
达达最近迷上了文学。
她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。
达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1…t]。
其中,m 是字符串 Str2 的长度,Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。
注意:请使用64位整数进行输入输出、储存和计算。
输入格式
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
第2~n+1 行:第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
输出格式
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
数据范围
2≤n≤100000,
2≤k≤9
1≤wi≤1012
输入样例:
4 2
1
1
2
2
输出样例:
12
2

题解

  1. 先了解什么是Hffuman编码:
    现有一个由5个不同符号组成的30个符号的字符串:
    BABACAC ADADABB CBABEBE DDABEEEBB
    1 首先计算出每个字符出现的次数(概率):
    在这里插入图片描述
    2 按照上题的思路合并:
    在这里插入图片描述
    3 沿二叉树顶部到每个字符路径,获得每个符号的编码
    在这里插入图片描述
  2. 问题转化: 在k叉Huffman中不同分支对应着不同的k进制数,从根节点开始遍历路径,其从根节点到各个字符路径上的权值连起来便是这个字符的Huffman编码(即Si)
  3. 因为我们要让我们所够造的HuffmanHuffman树的深度尽量小,所以我们在求HuffmanHuffman树时,对于权值相同的节点需要优先合并当前深度最小的分支(即让深度较大的分支后合并使其尽量向上,树的深度尽量小)。而如果当前的元素个数不能够造一棵完全kk叉树,添加mm个权值为00的虚节点处理。

代码

#include <iostream>
#include <queue>
#include <vector>
#include <algorithm>

using namespace std;
typedef long long LL;
typedef pair<LL, int> PLI;

int main()
{
    int n, k;
    cin >> n >> k;
    priority_queue<PLI, vector<PLI>, greater<PLI>> heap; //双关键字排序
    for(int i = 0; i < n; i++)
    {
        LL x;
        cin >> x;
        heap.push({x, 0});
    }
    
    while((n - 1) % (k - 1)) heap.push({0ll, 0}), n++; //根据贪心
    
    LL res = 0;
    
    while(heap.size() >= k)
    {
        LL s = 0;
        int depth = 0;
        for(int i = 0; i < k; i++)
        {
            auto t = heap.top();
            s += t.first;
            depth = max(depth, t.second); //节点的深度等于这k个元素的最大深度
            heap.pop();
        }
        
        res += s;
        heap.push({s, depth + 1});
    }
    
    cout << res << endl << heap.top().second << endl;
    
    return 0;
}



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值