哈夫曼树(大话数据结构6.12对哈夫曼树及哈夫曼编码讲的不错):
相关概念:
1.路径长度:树中两个节点间的分支数目称为路径长度。
2.树的路径长度是根节点到其他所有节点的路径长度之和。
3.节点的带权路径长度:该节点到根节点之间的路径长度与节点上权重的乘积。
4.树的带权路径长度(WPL):树中所有叶子节点的带权路径长度。
带权路径长度WPL最小的二叉树称作哈夫曼树(带权路径长度最小)。
哈夫曼树构造方法:
1.将权值节点排序,取最小的权值的两个节点作为左右节点(左节点为最小权值),生成一颗树,树的根节点权值为左右节点的权值和。
2.将左右节点在集合里删除,同时将根节点加入到集合中。
3.重复1-2,直到集合中只剩一个节点。
哈夫曼编码:一种数据压缩的方法,可以做到无损编码和无损解码。依据字符出现概率来构造不同长度的编码。
比如字符串“abbcccddddeeeee”共有5个字符,a,b,c,d,e出现的次数分别是1,2,3,4,5,
普通的编码方式:一共有5种字符,每个字符需要3个二进制(2^3=8>5)才能表示:则字符串(一共15个字符)需要:15*3=45位二进制字符表示。
哈夫曼编码:a-010,b-011,c-00,d-10,e-11,表示字符串需要3*1+3*2+2*3+2*4+2*5=33位二进制字符
原理是根据哈夫曼树得到每个字符的编码,达到使用不同长度的码字编码不同的字符(频率越高的字符长度越小)。
哈夫曼树的创建:
1.正常树的创建是从根节点开始由上而下创建树,而哈弗曼树是从下而上的顺序创建树(因为只知道叶子节点,并不知道根节点)。
2.由哈夫曼树得到各个字符的哈夫曼编码,一般按左0右1的方式。
哈夫曼编码代码实现:输入一串字符和字符的权值,输出每个字符的哈夫曼编码。
1.将字符按照权值排序,每次取最小权值和次小权值,