2.利用程序huff_enc和huff_dec进行以下操作(在每种情况下,利用由被压缩图像生成的码本)。
(a)对Sena、Sensin和Omaha图像进行编码。
答:
文件名 | 压缩前大小 | 压缩后大小 | 压缩比 |
Sence | 64k | 56.1k | 87.6% |
Sensin | 64k | 61k | 95% |
Omaha | 64k | 57k | 89.1% |
4.一个信源从符号集A={a1,a2,a3,a4,a5}中选择字母,概率为P(a1)=0.15,P(a2)=0.04,P(a3)=0.26,P(a4)=0.05,P(a5)=0.50。
(a)计算这个信源的熵。
(b)求这个信源的霍夫曼码。
(c)求(b)中代码的平均长度及其冗余度。
答:(a)由熵的计算公式,可得:
H=-=-0.15*log20.15 – 0.04* log20.04 - 0.26* log20.26 – 0.05* log20.05– 0.50* log20.5
≈ 0.15*2.74 + 0.04*4.64 + 0.26*1.94 + 0.05*4.32 + 0.50*1
≈0.411 + 0.1784 + 0.5044 + 0.216 + 0.5
≈1.8
(b)由霍夫曼编码的方式,可得:
a1:001 a2:0000 a3:01
a4:0001 a5:1
(c)平均长度:L=3*0.15 + 4*0.04 + 2*0.26 + 4*0.05 + 1*0.50=1.83
冗余度=L-H=1.83-1.8=0.03
2.思考:为什么压缩领域中的编码方法总和二叉树联系在一起呢?
答:为了使用不固定的码长表示单个字符,编码必须符合“前缀编码”的要求,即较短的编码决不能是较长编码的前缀。要构造符合这一要求的二进制编码体系,二叉树是最理想的选择。