假设用于通信的电文仅由8个字母组成,字母在电文中出现的频率分别为
0.07,0.19,0.02,0.06,0.32,0.03,0.21,0.10
请为这8个字母设计哈夫曼编码。
表格形式:
NO. | data | parent | Lchild | Rchild |
0 | 0.07(A) | 10 | NULL | NULL |
1 | 0.19(B) | 12 | NULL | NULL |
2 | 0.02(C) | 8 | NULL | NULL |
3 | 0.06(D) | 9 | NULL | NULL |
4 | 0.32(E) | 13 | NULL | NULL |
5 | 0.03(F) | 8 | NULL | NULL |
6 | 0.21(G) | 12 | NULL | NULL |
7 | 0.10(H) | 10 | NULL | NULL |
8 | 0.05 | 9 | 2 | 5 |
9 | 0.11 | 11 | 8 | 3 |
10 | 0.17 | 11 | 0 | 7 |
11 | 0.28 | 13 | 9 | 10 |
12 | 0.4 | 14 | 1 | 6 |
13 | 0.6 | 14 | 11 | 4 |
14 | 1.0 | NULL | 12 | 13 |
该表格也就是静态三叉链表,小编自己由多加了一列编号,三叉链表从左到右依次为权值(data)、双亲序号(parent)、左孩子序号(Lchild)、右孩子序号(Rchild)。
通俗的说,求哈夫曼编码就是根据三叉链表计算出最优二叉树,算法是(在链表权值内取最小的两位权值相加,然后删去最小的两位数,将它们的和存入链表,然后重复取最小的两个数,存入两个数的和,删去原来的两个相加的小数。这一个循环的过程,一直到最后算出的那个最终的数,就是最优二叉树的权值)
本题来讲,第一步就是找到两个最小的数,编号分别为2(0.02),5(0.03).【一般以较小的数为左孩子,较大的数为右孩子】然后写入到编号为8的左孩子和右孩子的二叉链表处。直至填满编号为14的三叉链表。
二叉树表示:
根据三叉链表,便可以画出二叉树,A-H对应着相应的数据,可以在二叉树中找到对应的位置,按照左0右1的编码规则,得到每个字母对应的哈夫曼编码。(也就是每个字母对应的二叉树路径)
Endeavor