huffman 树称为最优二叉树,用其来对字符编码是一种比较好的选择,huffman树的实现也比较简单,构造huffman树的思想就是每次从序列中取出权值最小的两个,然后构造出一个树,然再去构造,一直到只有一个根节点为止。根据这个“每次从中选出最小的两个值”,我们应该想到优先队列,优先队列可以迅速的从一堆数中找出极小值或者极大值,用优先队列的这个性质可以很简单的构造huffman树。
当然,构造huffman树只是第一步,构造完成之和,我们需要开始编码,其实就是遍历一遍整棵huffman树,然后给每个叶子节点一个编码,可以用“往左走填0,往右走填1”的方法来编码。
解码就是遍历,到叶子节点也就可以取到这个编码所对应的值了。
下面是我很久以前写的一个实现,可以输入一篇文章,该程序会首先对每个出现的单词计数(频率),然后构造huffman编码等,同时你还可以输入编码以解码。
/*
编号:004_13
名字:_Huffman_Tree
描述:Huffman树与应用类
备注:本类仅对小写英文字符实现,对于不同需求,请自行修改代码
*/
class _Huffman_Tree
{
public:
//the character and num
//_Character_Num[character-'a'].
int _Character_Num[26];
int _All_Character_Num;
char _Element_Data;
int _Cost_character