AcWing 148. 合并果子 + 荷马史诗(Huffman树问题 + 堆)

最新推荐文章于 2024-09-25 10:36:42 发布

哆啦c梦~~

最新推荐文章于 2024-09-25 10:36:42 发布

阅读量266

点赞数

分类专栏： # 堆文章标签：算法数据结构 c++

本文链接：https://blog.csdn.net/xiaoxiongyuan__s/article/details/109294625

版权

堆专栏收录该内容

3 篇文章 0 订阅

订阅专栏

合并果子–二叉Huffman树

题目描述

在一个果园里，达达已经将所有的果子打了下来，而且按果子的不同种类分成了不同的堆。
达达决定把所有的果子合成一堆。
每一次合并，达达可以把两堆果子合并到一起，消耗的体力等于两堆果子的重量之和。
可以看出，所有的果子经过n-1次合并之后，就只剩下一堆了。
达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。
因为还要花大力气把这些果子搬回家，所以达达在合并果子时要尽可能地节省体力。
假定每个果子重量都为1，并且已知果子的种类数和每种果子的数目，你的任务是设计出合并的次序方案，使达达耗费的体力最少，并输出这个最小的体力耗费值。
例如有3种果子，数目依次为1，2，9。
可以先将1、2堆合并，新堆数目为3，耗费体力为3。
接着，将新堆与原先的第三堆合并，又得到新的堆，数目为12，耗费体力为12。
所以达达总共耗费体力=3+12=15。
可以证明15为最小的体力耗费值。
输入格式
输入包括两行，第一行是一个整数n，表示果子的种类数。
第二行包含n个整数，用空格分隔，第i个整数ai是第i种果子的数目。
输出格式
输出包括一行，这一行只包含一个整数，也就是最小的体力耗费值。
输入数据保证这个值小于231。
数据范围
1≤n≤10000,
1≤ai≤20000
输入样例：
3
1 2 9
输出样例：
15

题解

可以知道整个合并过程就是一个树的过程。可以证明：合并总体力就是各叶子结点到根节点的距离*叶子结点的值这样，当最小的两个点在树的叶子结点并且互为兄弟节点时，总和最小。
可以用一个小顶堆维护这个过程，先取出最小的两个点，算出这两个点的和，再加入到堆中。

代码

#include <iostream>
#include <queue>

using namespace std;

int main()
{
    int n;
    cin >> n;
    int x;
    priority_queue<int, vector<int>, greater<int>> heap;
    for(int i = 0; i < n; i++)
    {
        cin >> x;
        heap.push(x);
    }
    
    int res = 0;
    while(heap.size() > 1)
    {
        int a = heap.top();
        heap.pop();
        int b  = heap.top();
        heap.pop();
        res += a + b;
        heap.push(a + b);
    }
    
    cout << res << endl;
    
    return 0;
}

荷马史诗 – K叉Huffman树

题目描述

追逐影子的人，自己就是影子。 ——荷马
达达最近迷上了文学。
她喜欢在一个慵懒的午后，细细地品上一杯卡布奇诺，静静地阅读她爱不释手的《荷马史诗》。
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词，从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。
达达想要用 k 进制串 si 来替换第 i 种单词，使得其满足如下要求:
对于任意的 1≤i,j≤n，i≠j，都有：si 不是 sj 的前缀。
现在达达想要知道，如何选择 si，才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下，达达还想知道最长的 si 的最短长度是多少？
一个字符串被称为 k 进制字符串，当且仅当它的每个字符是 0 到 k−1 之间（包括 0 和 k−1）的整数。
字符串 Str1 被称为字符串 Str2 的前缀，当且仅当：存在 1≤t≤m，使得 Str1=Str2[1…t]。
其中，m 是字符串 Str2 的长度，Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。
注意:请使用64位整数进行输入输出、储存和计算。
输入格式
输入文件的第 1 行包含 2 个正整数 n,k，中间用单个空格隔开，表示共有 n 种单词，需要使用 k 进制字符串进行替换。
第2~n+1 行：第 i+1 行包含 1 个非负整数 wi，表示第 i 种单词的出现次数。
输出格式
输出文件包括 2 行。
第 1 行输出 1 个整数，为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数，为保证最短总长度的情况下，最长字符串 si 的最短长度。
数据范围
2≤n≤100000,
2≤k≤9
1≤wi≤1012
输入样例：
4 2
1
1
2
2
输出样例：
12
2

题解

先了解什么是Hffuman编码：
现有一个由5个不同符号组成的30个符号的字符串：
BABACAC ADADABB CBABEBE DDABEEEBB
1 首先计算出每个字符出现的次数（概率）：

2 按照上题的思路合并：

3 沿二叉树顶部到每个字符路径，获得每个符号的编码

问题转化：在k叉Huffman中不同分支对应着不同的k进制数，从根节点开始遍历路径，其从根节点到各个字符路径上的权值连起来便是这个字符的Huffman编码（即Si）
因为我们要让我们所够造的HuffmanHuffman树的深度尽量小，所以我们在求HuffmanHuffman树时，对于权值相同的节点需要优先合并当前深度最小的分支（即让深度较大的分支后合并使其尽量向上，树的深度尽量小）。而如果当前的元素个数不能够造一棵完全kk叉树，添加mm个权值为00的虚节点处理。

代码

#include <iostream>
#include <queue>
#include <vector>
#include <algorithm>

using namespace std;
typedef long long LL;
typedef pair<LL, int> PLI;

int main()
{
    int n, k;
    cin >> n >> k;
    priority_queue<PLI, vector<PLI>, greater<PLI>> heap; //双关键字排序
    for(int i = 0; i < n; i++)
    {
        LL x;
        cin >> x;
        heap.push({x, 0});
    }
    
    while((n - 1) % (k - 1)) heap.push({0ll, 0}), n++; //根据贪心
    
    LL res = 0;
    
    while(heap.size() >= k)
    {
        LL s = 0;
        int depth = 0;
        for(int i = 0; i < k; i++)
        {
            auto t = heap.top();
            s += t.first;
            depth = max(depth, t.second); //节点的深度等于这k个元素的最大深度
            heap.pop();
        }
        
        res += s;
        heap.push({s, depth + 1});
    }
    
    cout << res << endl << heap.top().second << endl;
    
    return 0;
}