AcWing 149. 荷马史诗（哈夫曼树、贪心）

最新推荐文章于 2024-04-25 00:15:00 发布

恋花飘落

最新推荐文章于 2024-04-25 00:15:00 发布

阅读量299

点赞数

分类专栏：暑假训练题二叉堆思维贪心文章标签：哈夫曼树

本文链接：https://blog.csdn.net/qq_42279796/article/details/98884392

版权

暑假训练题同时被 3 个专栏收录

26 篇文章 1 订阅

订阅专栏

思维

26 篇文章 0 订阅

订阅专栏

贪心

8 篇文章 0 订阅

订阅专栏

题干：

但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，达达想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词，从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。

达达想要用 k 进制串 si 来替换第 i 种单词，使得其满足如下要求:

对于任意的 1≤i,j≤n，i≠j，都有：si 不是 sj 的前缀。

现在达达想要知道，如何选择 si，才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下，达达还想知道最长的 si 的最短长度是多少？

一个字符串被称为 k 进制字符串，当且仅当它的每个字符是 0 到 k−1 之间（包括 0 和 k−1）的整数。

字符串 Str1 被称为字符串 Str2 的前缀，当且仅当：存在 1≤t≤m，使得 Str1=Str2[1…t]。

其中，m 是字符串 Str2 的长度，Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。

输入文件的第 1 行包含 2 个正整数 n,k，中间用单个空格隔开，表示共有 n 种单词，需要使用 k 进制字符串进行替换。

第2~n+1 行：第 i+1 行包含 1 个非负整数 wi，表示第 i 种单词的出现次数。

输出文件包括 2 行。

第 1 行输出 1 个整数，为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数，为保证最短总长度的情况下，最长字符串 si 的最短长度。

2≤n≤100000
2≤k≤9

思路：

题目巨长，总结一下就是我们要将《荷马史诗》中的单词重新编码，已知单词种类数和出现的次数(因为要重新编码所以不在意原长度)，将每一个单词重新编码成一个k进制数，然后求编码后最短长度，这就类似Huffman编码。

因为是k进制数，所以每一位上最多编码k个单词（例如3进制可以用0、1、2表示），这样就是个k叉Huffman树（即一次合并k个值），又因为存在n%k！=0的情况，这种会导致最下层合并的节点多，上层合并的节点少而导致和增大，所以我们可以进行补零操作。

然后考虑最长字符串的最短长度，因为用了Huffman树，所以我们的最长字符串一般是最小的，但由于存在权值相同的点深度不同的情况，所以在这种情况下优先合并深度低的点。

#include <cstdio>
#include <cstring>
#include <cmath>
#include <queue>
#include <iostream>
#include <algorithm>
#define ll long long
using namespace std;
pair<ll,int>t;
priority_queue<pair<ll,int>,vector<pair<ll,int> >,greater<pair<ll,int> > >q;
ll ans=0,x;
int main()
{
    int n,k;
    scanf("%d%d",&n,&k);
    for(int i=0;i<n;i++){
        scanf("%lld",&x);
        q.push({x,0});
    }
    while((n-1)%(k-1))
        q.push({0,0}),n++;
    while(q.size()>1){
        ll sum=0;
        int mx=0;
        for(int i=0;i<k;i++){
            sum+=q.top().first;
            mx=max(mx,q.top().second);
            q.pop();
        }
        ans+=sum;
        //printf("%lld\n",ans);
        q.push({sum,mx+1});
    }
    printf("%lld\n%d\n",ans,q.top().second);
    return 0;
}

恋花飘落

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
AcWing 149. 荷马史诗（哈夫曼树、贪心）

题干：但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，达达想通过一种编码方式使得它变得短一些。一部《荷马史诗》中有 n 种不同的单词，从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。达达想要用 k 进制串 si 来替换第 i 种单词，使得其满足如下要求:对于任意的 1≤i,j≤n，i≠j，都有：si 不是 sj 的前缀。现在达达想要知道，如何选择 ...
复制链接

扫一扫

专栏目录