PTA 哈夫曼编码

题目

给定一段文字,如果我们统计出字母出现的频率,是可以根据哈夫曼算法给出一套编码,使得用此编码压缩原文可以得到最短的编码总长。然而哈夫曼编码并不是唯一的。例如对字符串"aaaxuaxz",容易得到字母 ‘a’、‘x’、‘u’、‘z’ 的出现频率对应为 4、2、1、1。我们可以设计编码 {‘a’=0, ‘x’=10, ‘u’=110, ‘z’=111},也可以用另一套 {‘a’=1, ‘x’=01, ‘u’=001, ‘z’=000},还可以用 {‘a’=0, ‘x’=11, ‘u’=100, ‘z’=101},三套编码都可以把原文压缩到 14 个字节。但是 {‘a’=0, ‘x’=01, ‘u’=011, ‘z’=001} 就不是哈夫曼编码,因为用这套编码压缩得到 00001011001001 后,解码的结果不唯一,“aaaxuaxz” 和 “aazuaxax” 都可以对应解码的结果。本题就请你判断任一套编码是否哈夫曼编码。

输入

首先第一行给出一个正整数 N(2≤N≤63),随后第二行给出 N 个不重复的字符及其出现频率,格式如下:

c[1] f[1] c[2] f[2] ... c[N] f[N]

其中c[i]是集合{‘0’ - ‘9’, ‘a’ - ‘z’, ‘A’ - ‘Z’, ‘_’}中的字符;f[i]是c[i]的出现频率,为不超过 1000 的整数。再下一行给出一个正整数 M(≤1000),随后是 M 套待检的编码。每套编码占 N 行,格式为:

c[i] code[i]

其中c[i]是第i个字符;code[i]是不超过63个’0’和’1’的非空字符串。

输出

对每套待检编码,如果是正确的哈夫曼编码,就在一行中输出"Yes",否则输出"No"。

注意:最优编码并不一定通过哈夫曼算法得到。任何能压缩到最优长度的前缀编码都应被判为正确。

输入样例

7
A 1 B 1 C 1 D 3 E 3 F 6 G 6
4
A 00000
B 00001
C 0001
D 001
E 01
F 10
G 11
A 01010
B 01011
C 0100
D 011
E 10
F 11
G 00
A 000
B 001
C 010
D 011
E 100
F 101
G 110
A 00000
B 00001
C 0001
D 001
E 00
F 10
G 11

输出样例

Yes
Yes
No
No

题目分析

本题经过分析,最优编码并不一定通过哈夫曼算法得到,但是哈夫曼算法得到的一定是最优编码,由此计算得到的带权路径长度(WPL)便是最短的。先将输入中的各大编码方式计算出其对应的带权路径长度之和,与通过哈夫曼算法得到的WPL进行比较,完成第一轮筛选。若是与哈夫曼算法得到的WPL相等,那么再对该编码方式进行前缀判定,存在前缀包含则判错,否则输出Yes。

带权路径长度(WPL):假设二叉树有n个叶结点,每个叶结点带有权值 w k w_k wk,从根节点到每个叶结点的长度为 l k l_k lk,则每个叶结点的WPL之和为 W P L = ∑ k = 1 n w k × l k WPL=\sum_{k=1}^{n}w_k\times l_k WPL=k=1nwk×lk
哈夫曼编码:用二叉树进行字符编码,所有字符均在叶结点上,左右分支为:0,1。
哈夫曼树<最优二叉树>:带权路径长度之和最小的二叉树。
哈夫曼树特点:没有度为1的结点。对于1组权值可能有多种哈夫曼树,但WPL相同。

运用哈夫曼算法构造哈夫曼树:每次将权值最小的两值合并。
e.g. {1,2,3,4,5}=>{3,3,4,5}=>{6,4,5}=>{6,9}=>{15}
在这里插入图片描述

代码

#include<iostream>
#include<queue>
#include<vector>
#include<string> 
#include<map>
using namespace std;

int c[100],f[100],n,m;
string code[100];//存储序列
char ch[100];
map<char,int> mp;

bool check(int WPL){
	int a,b,wpl = 0;
	for(int i = 0;i<n;++i){
		for(int j = i+1;j<n;++j){
			a = code[i].find(code[j]);
			//前缀判断,存在则返回第一个位置,否则返回最后一个位置
			b = code[j].find(code[i]);
			if((a==0) || (b==0)){
				return false;
			}
		}
		wpl+=mp[ch[i]]*code[i].length();//计算当前wpl
	}
	if(wpl==WPL) return true;
	else return false;
}

int main(){
	cin>>n;
	priority_queue<int,vector<int>,greater<int> > pqu;//优先队列,排序
	for(int i = 0;i<n;++i){
		scanf(" %c %d",&c[i],&f[i]);
		pqu.push(f[i]);
		mp[c[i]] = f[i];//存储字母的权值
	}
	int WPL= 0,tmp = 0;
	while(pqu.size()>1){//compute WPL
		tmp = pqu.top();
		pqu.pop();
		tmp+=pqu.top();
		pqu.pop();
		WPL+=tmp;
		pqu.push(tmp);
	}
	cin >> m;
	for(int i = 0;i<m;++i){
		for(int j = 0;j<n;++j){
			scanf(" %c",&ch[j]);
			cin >>code[j];
		}
		if(check(WPL))
			cout <<"Yes"<<endl;
		else
			cout <<"No"<<endl;
	}
	return 0;
}

运行结果

在这里插入图片描述

  • 4
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

registor11

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值