树与森林基本概念(3)

本文介绍了Huffman编码和Huffman树在文本压缩中的应用,通过解决合并果子问题和优化单词替换问题,展示了如何设计编码方案以最小化体力消耗和文本长度,使用了优先队列和动态规划的思想。
摘要由CSDN通过智能技术生成


1. Huffman编码和Huffman树
(1) Huffman编码
a. 前缀编码: 是指对字符集进行编码时,要求字符集中任一字符的编码都不是其它字符的编码的前缀。

在一个果园里,达达已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。

达达决定把所有的果子合成一堆。

每一次合并,达达可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。

可以看出,所有的果子经过 n−1次合并之后,就只剩下一堆了。

达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。

因为还要花大力气把这些果子搬回家,所以达达在合并果子时要尽可能地节省体力。

假定每个果子重量都为 11,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使达达耗费的体力最少,并输出这个最小的体力耗费值。

例如有 33 种果子,数目依次为 1,2,91,2,9。

可以先将 1、21、2 堆合并,新堆数目为 33,耗费体力为 33。

接着,将新堆与原先的第三堆合并,又得到新的堆,数目为 1212,耗费体力为 1212。

所以达达总共耗费体力=3+12=15=3+12=15。

可以证明 1515 为最小的体力耗费值。

输入格式

输入包括两行,第一行是一个整数 n,表示果子的种类数。

第二行包含 n个整数,用空格分隔,第 i 个整数 ai是第 i 种果子的数目。

输出格式

输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。

#include<algorithm>
#include<iostream>
#include<queue>
using namespace std;
int main()
{
  int n;
  cin>>n;
  priority_queue<int,vector<int>,greater<int>>heap;
  while(n--)
  {
    int x;
    cin>>x;
    heap.push(x);
  }
  int res=0;
  while(heap.size()>1)
  {
    auto a=heap.top();heap.pop();
    auto b=heap.top();heap.pop();
    res+=a+b;
    heap.push(a+b);
  }
  cout<<res<<endl;
}


b. 树的带权路径长度(WPL)
c. 构造过程

追逐影子的人,自己就是影子。 ——荷马

达达最近迷上了文学。

她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。

但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词,从 11 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。

达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:

都有:si不是 sj 的前缀。

现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?

一个字符串被称为 k进制字符串,当且仅当它的每个字符是 00 到 k−1 之间(包括 00 和 k−1)的整数。

字符串 Str11 被称为字符串 Str22 的前缀,当且仅当:存在 1≤t≤m1≤,使得 Str1=Str2[1..t]1=2[1..]。

其中,m 是字符串 Str22 的长度,Str2[1..t]2[1.. 表示 Str22 的前 t 个字符组成的字符串。

注意:请使用 6464 位整数进行输入输出、储存和计算。

输入格式

输入文件的第 11 行包含 22 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

第 2∼n+12∼+1 行:第 i+1 行包含 11 个非负整数 wi,表示第 i 种单词的出现次数。

#include <iostream>
#include <cstring>
#include <algorithm>

#include <vector>
#include <queue>
#define x first
#define y second 
using namespace std;
typedef long long LL;

typedef pair<LL, int> PLI;

int main()
{
  int n,k;
  cin>>n>>k;
  priority_queue<PLI,vector<PLI>,greater<PLI>>heap;
  while(n--)
  {
    LL w;
    cin>>w;
    heap.push({w,0});
  }
  while((heap.size()-1)%(k-1))heap.push({0,0});
  LL res=0;
  while(heap.size()>1)
  {
    LL s=0;
    int depth=0;
    for(int i=0;i<k;i++)
    {
      auto t=heap.top();
      heap.pop();
      s+=t.x;
      depth=max(depth,t.y);
    }
    heap.push({s,depth+1});
    res+=s;
  }
  cout<<res<<endl<<heap.top().y;
}

(2) Huffman树
(3) 应用

  • 16
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值