哈夫曼编码得先构建哈夫曼树,而依据哈弗曼树的定义,一棵二叉树要使其WPL值最小即该树的带权路径长度达到最小,必须使权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。
从而得到最优二叉树(哈夫曼树)的构造方法:(定义来自百度百科)
假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:
(1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);
(2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;
(3)从森林中删除选取的两棵树,并将新树加入森林;
(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。
所谓树的带权路径长度(WPL),就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。
eg:对于给定的字符集合C = {c1, c2, ... cn},并根据字符权值集合W = {w1, w2, ... wn}来构造哈夫曼编码,流程如下:
- 将字符集C作为叶子节点;
- 将权值集W作为叶子节点的权值;
- 对哈夫曼树的所有分支,左子树分支编码为0,右子树分支编码为1;
直接例题分析(注释在代码中给出):
eg:给定6个字符a~f,他们的权值集合W={2,3,4,7,8,9},试构造关于W的一颗哈夫曼树,求其带权路径长度和每个字符的哈夫曼编码。
代码如下:
#include<bits/stdc++.h>
using namespace std;
typedef struct NNN {
int weight = 0;
int parent = 0, lchild = 0, rchild = 0;
}haffm;
map<int, string>arr;//存节点对应的编码
void selct(haffm*& h, int k) {
int min1 = 9999, min2 = 9999;
int flag1 = 999, flag2 = 999;//两个最小值
//找出两个最小的数值的下标
for (int i = 1; i < k; i++)
{
if (h[i].parent == 0)
{
if (h[i].weight < min1)
{
min2 = min1;
min1 = h[i].weight;
flag2 = flag1;
flag1 = i;
}
else if (h[i].weight < min2)
{
min2 = h[i].weight;
flag2 = i;
}
}
}
//flag1 是最小的,flag2是第二小的
h[flag1].parent = k;
h[flag2].parent = k;
h[k].lchild = flag1;
h[k].rchild = flag2;
h[k].weight = h[flag1].weight + h[flag2].weight;//找出来了就好
}
void creathaff(int a[], int n, haffm*& h) {
int m = 2 * n - 1;
h = new haffm[m + 5];//要开辟一个这么大的区间
for (int i = 1; i <= n; i++) {
h[i].weight = a[i - 1];//存入前n个(也是你输入的数的权重)
}
for (int i = n + 1; i <= m; i++) {
selct(h, i);//开始构造选择
}
}
void finds(haffm*& h, int n, string d)//从顶端开始,而且我们只要存叶子节点,处理编码
{//处理叶子节点n号
if (h[n].lchild != 0)
{
d += '0';
finds(h, h[n].lchild, d);
d.erase(d.end() - 1);
}//左右寻找区间
if (h[n].rchild != 0)
{
d += '1';
finds(h, h[n].rchild, d);
d.erase(d.end() - 1);
}
if (h[n].lchild == 0 && h[n].rchild == 0)
{
arr[h[n].weight] = d;
}//存入
}
int main()
{
int n;
cout << "请输入一共有多少个数" << endl;
cin >> n;
int a[1000];
cout << "请输入" << n << "个数" << endl;
for (int i = 0; i < n; i++)
{
cin >> a[i];
}//输入所有的数
sort(a, a + n);//排序一下,方便找两个最小值
haffm* h;
creathaff(a, n, h);//进入构造函数
string d;
finds(h, 2 * n - 1, d);
int sum = 0;
for (int i = 0; i < n; i++) {
cout << a[i] << " " << arr[a[i]] << " " << endl;
sum += a[i] + arr[a[i]].size();
}
cout << "权值 : "<<sum;//权值
}
编译结果: