一、DS二叉树–赫夫曼树的构建与编码(含代码框架)
1.题目
给定n个权值,根据这些权值构造huffman树,并进行huffman编码
参考课本算法,注意数组访问是从位置1开始
要求:赫夫曼的构建中,默认左孩子权值不大于右孩子权值
2.代码
#include<iostream>
#include<string>
#include<cstring>
using namespace std;
const int MaxW = 9999999; // 假设结点权值不超过9999999
// 定义huffman树结点类
class HuffNode
{
public:
int weight; // 权值
int parent; // 父结点下标
int leftchild; // 左孩子下标
int rightchild; // 右孩子下标
};
// 定义赫夫曼树类
class HuffMan
{
private:
void MakeTree(); // 建树,私有函数,被公有函数调用
void SelectMin(int pos, int* s1, int* s2); // 从 1 到 pos 的位置找出权值最小的两个结点,
// 把结点下标存在 s1 和 s2 中
public:
int len; // 结点数量
int lnum; // 叶子数量
HuffNode* huffTree; // 赫夫曼树,用数组表示
string* huffCode; // 每个字符对应的赫夫曼编码
void MakeTree(int n, int wt[]); // 公有函数,被主函数main调用
void Coding(); // 公有函数,被主函数main调用
void Destroy();
};
// 构建huffman树
void HuffMan::MakeTree(int n, int wt[])
{
// 参数是叶子结点数量和叶子权值
// 公有函数,对外接口
int i;
lnum = n;
len = 2 * n - 1;
huffTree = new HuffNode[2 * n];
huffCode = new string[lnum + 1]; // 位置从 1 开始计算
// huffCode实质是个二维字符数组,第 i 行表示第 i 个字符对应的编码
// 赫夫曼树huffTree初始化
for (i = 1; i <= n; i++)
{
huffTree[i].weight = wt[i - 1]; // 第0号不用,从1开始编号
}
for (i = 1; i <= len; i++)
{
if (i > n)
{
huffTree[i].weight = 0; // 前n个结点是叶子,已经设置
}
huffTree[i].parent = 0;
huffTree[i].leftchild = 0;
huffTree[i].rightchild = 0;
}
MakeTree(); // 调用私有函数建树
}
void HuffMan::SelectMin(int pos, int* s1, int* s2)
{
// 找出最小的两个权值的下标
// 函数采用地址传递的方法,找出两个下标保存在 s1 和 s2 中
int w1, w2, i;
w1 = w2 = MaxW; // 初始化w1和w2为最大值,在比较中会被实际的权值替换
*s1 = *s2 = 0;
for (i = 1; i <= pos; i++)
{
// 比较过程如下:
// 如果第 i 个结点的权值小于 w1,且第 i 个结点是未选择的结点,提示:如果第 i 结点未选择,它父亲为 0
// 把第 w1 和 s1 保存到 w2 和 s2,即原来的第一最小值变成第二最小值
// 把第 i 结点的权值和下标保存到 w1 和 s1,作为第一最小值
// 否则,如果第 i 结点的权值小于 w2,且第 i 结点是未选择的结点
// 把第 i 结点的权值和下标保存到 w2 和 s2,作为第二最小值
if (w1 > huffTree[i].weight && !huffTree[i].parent) {
w2 = w1;
*s2 = *s1;
w1 = huffTree[i].weight;
*s1 = i;
}
else if (w2 > huffTree[i].weight && !huffTree[i].parent) {
w2 = huffTree[i].weight;
*s2 = i;
}
}
}
void HuffMan::MakeTree()
{
// 私有函数,被公有函数调用
int i, s1, s2;
for (i = lnum + 1; i <= len; i++)
{
SelectMin(i - 1, &s1, &s2); // 找出两个最小权值的下标放入 s1 和 s2 中
// 将找出的两棵权值最小的子树合并为一棵子树,过程包括
// 结点 s1 和结点 s2 的父亲设为 i
// 结点 i 的左右孩子分别设为 s1 和 s2
huffTree[s1].parent = huffTree[s2].parent = i;
huffTree[i].leftchild = s1;
huffTree[i].rightchild = s2;
// 结点 i 的权值等于 s1 和 s2 的权值和
huffTree[i].weight = huffTree[s1].weight + huffTree[s2].weight;
}
}
// 销毁赫夫曼树
void HuffMan::Destroy()
{
len = 0;
lnum = 0;
delete[]huffTree;
delete[]huffCode;
}
// 赫夫曼编码
void HuffMan::Coding()
{
char* cd;
int i, c, f, start;
// 求 n 个结点的赫夫曼编码
cd = new char[lnum]; // 分配求编码的工作空间
cd[lnum - 1] = '\0'; // 编码结束符
for (i = 1; i <= lnum; ++i)
{
// 逐个字符求赫夫曼编码
start = lnum - 1; // 编码结束符位置
// 参考课本P147算法6.12 HuffmanCoding代码
for (c = i, f = huffTree[i].parent; f != 0; c = f, f = huffTree[f].parent)
if (huffTree[f].leftchild == c)
{
cd[--start] = '0';
}
else
{
cd[--start] = '1';
}
huffCode[i].assign(&cd[start]); // 把cd中从start到末尾的编码复制到huffCode中
}
delete[]cd; // 释放工作空间
}
// 主函数
int main()
{
int t, n, i, j;
int wt[800];
HuffMan myHuff;
cin >> t;
while (t--)
{
cin >> n;
for (j = 0; j < n; j++)
{
cin >> wt[j];
}
myHuff.MakeTree(n, wt);
myHuff.Coding();
for (j = 1; j <= n; j++)
{
cout << myHuff.huffTree[j].weight << '-'; // 输出各权值
cout << myHuff.huffCode[j] << endl; // 输出各编码
}
myHuff.Destroy();
}
return 0;
}
3.反思
1)在主函数中。
将输入的权值以数组的方式保存。再通过带参数的MakeTree(int n,int * wt)进行建树,再进行编码,按要求输出后销毁析构该对象。
2)在带参建树时。
a)提及了叶子数和节点数。
以下是他们的概念:
(1)节点包括,中间节点(内部节点),叶节点以及根节点。
(2)度数为0的节点为叶节点(即叶子),对于一棵树,只有唯一一个根节点。
(3)节点数=叶子数*2-1;
b)建树时,定义HuffTree的HuffNode数组的长度为2n而非2n-1,是因为从位置1开始算。HuffCode同理。
c)初始化HuffTree,将权值逐个赋予到HUffTree中,其余非叶子节点的权值用0进行初始化,且将全部节点的双亲结点,左右孩子节点初始化,接着用无参的私有函数MakeTree()进行建树。
3)无参建树时
a)从叶子数+1开始循环,至等于节点数时停止,调用了SelectMin(int pos, int* s1, int* s2);
b)SelectMin(int pos, int* s1, int* s2)函数
从 1 到 pos 的位置找出权值最小的两个结点,把结点下标存在 s1 和 s2 中。
比较过程如下:
(1)如果第 i 个结点的权值小于 w1,且第 i 个结点是未选择的结点,提示:如果第 i 结点未选择,它父亲为 0:把第 w1 和 s1 保存到 w2 和 s2,即原来的第一最小值变成第二最小值:把第 i 结点的权值和下标保存到 w1 和 s1,作为第一最小值。
(2)否则,如果第 i 结点的权值小于 w2,且第 i 结点是未选择的结点:把第 i 结点的权值和下标保存到 w2 和 s2,作为第二最小值。
c)将找出的两棵权值最小的子树合并为一棵子树,过程包括
(1) 结点 s1 和结点 s2 的父亲设为 i
(2)结点 i 的左右孩子分别设为 s1 和 s2
(3)结点 i 的权值等于 s1 和 s2 的权值和
d)至此建树完成,进行编码。
4)编码
a)先分配求编码的工作空间,编码的长度等于叶子数-2;
b)设置编码结束符,即数组的最后一位为‘\0’;
c)逐个字符求哈夫曼编码,参考课本P147算法6.12 HuffmanCoding代码,再将cd中从start到末尾的编码复制到huffCode中。