1.正文
1.1 哈夫曼编码
对字符串{“aabbbc”}进行哈夫曼编码:
1.找出所有字符:a,b,c
2.统计字符的频率:{2,3,1}
3.以字符的频率作为叶子的权值,构建哈夫曼树
1.2 哈夫曼树
1.2.1 什么是哈夫曼树
给定 N 个权值作为 N 个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树 (Huffman Tree)。
相关概念:
1、路径和路径长度
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为 1 ,则从根结点到第 L 层结点的路径长度为 L−1 。
2、结点的权及带权路径长度
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
3、树的带权路径长度
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为 WPL 。
1.2.2 实现方法
因为是建图,所以不适宜用vector,而用struct(编号,左右儿子,父节点)和优先队列(在struct中重载运算符,改变排序方式)。思路有了,下面看代码:
#include<bits/stdc++.h>
using namespace std;
#define int long long
typedef pair<int, int> PII;
#define endl '\n'
const int N = 1e3 + 10;
struct node
{
int id, lson, rson, v;
bool operator<(const node &other) const{
return v > other.v;
}//重载运算符
node (int id = 0, int lson = 0, int rson = 0, int v = 0): id(id), lson(lson), rson(rson), v(v){}
//id:自己的编号信息,lrson:左右儿子的编号信息,v:节点的权值
};
int n, idx, depth[N * 2], ans;
node a[N * 2];//二叉树最坏情况是 N * 2 - 1
priority_queue<node> q;
void dfs(int u){
int lson = a[u].lson;
int rson = a[u].rson;
if (lson){
depth[lson] = depth[u] + 1;
dfs(lson);
}
if (rson){
depth[rson] = depth[u] + 1;
dfs(rson);
}
}
signed main(){
ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
cin >> n;
for (int i = 1;i <= n;i++){
cin >> a[i].v;
a[i].id = ++idx;
}
//构建哈夫曼树
for (int i = 1;i <= n;i++){
q.push(a[i]);
}
while (q.size() > 1){
auto top1 = q.top();
q.pop();
auto top2 = q.top();
q.pop();
++idx;
a[idx] = node(idx, top1.id, top2.id, top1.v + top2.v);
q.push(a[idx]);
}
dfs(idx);
for (int i = 1;i <= n;i++){
ans += depth[i] * a[i].v;
}
cout << ans;
return 0;
}
2.结尾
好了,内容就到这里了,给个赞吧~