哈夫曼编码的应用
已知通讯中要传输的一段电文是{CAS;CAT;SAT;AT},要传输的字符集是D={C,A,S,T, ;},请根据要传输字符出现的频率,为这段电文设计一套二进制编码,使其传输的电文长度达到最短。
构造哈夫曼树和哈夫曼编码步骤如下:
1、统计原始数据中的各种符号出现的频率,并将个符号视之为单独的结点
2、将各结点按照频率值的大小排成一个有序序列
3、从队列中选择频率值最小的两个结点,作为新结点的左右孩子(左孩子结点的频率小于右孩子结点)
4、将左孩子结点的频率相加,作为新结点的频率
5、使用新结点替代其左孩子结点加入有序序列,参与下一轮比较
6、重复上述2、3、4、5步,直到队列全部合并,得到原始编码数据的哈夫曼树
7、在每次合并结点时,将合并的左右符号结点分别赋值为0和1,得到哈夫曼树。至此,从哈夫曼树的根到某结点的路径上所经过各结点的0和1得到一系列01编码就是该结点的哈夫曼编码
根据以上的步骤,我们可以先得到各个字符出现的频率,C:2次,A:4次,S:2次,T:3 次,;:3次
译码
C:110、S:111、T:00、A:10、;:01
C | A | S | ; | C | A |
---|---|---|---|---|---|
110 | 10 | 111 | 01 | 110 | 10 |
T | ; | S | A | T | ; |
00 | 01 | 111 | 10 | 00 | 01 |
A | T | ||||
10 | 00 |
{ 11010111011101000011111000011000 } \{11010111011101000011111000011000\} {11010111011101000011111000011000}