第二次作业

最新推荐文章于 2022-04-18 00:22:05 发布

weixin_30507269

最新推荐文章于 2022-04-18 00:22:05 发布

阅读量70

点赞数

原文链接：http://www.cnblogs.com/bojack/p/4784751.html

版权

一、参考书《数据压缩导论（第4版）》 Page 66

2.利用程序huff_enc和huff_dec进行以下操作（在每种情况下，利用由被压缩图像生成的码本）。

(a)对Sena,Sensin和Omaha图像进行编码。

文件名	源文件大小（kb）	压缩后大小（kb）	压缩比
Sena	64	57	89.06%
OMAHA	64	58	90.63%
SINAN	64	61	95.31%

4.一个信源从符号集A={a1,a2,a3,a4,a5}中选择字母，概率为P(a1)=0.15,P(a2)=0.04,P(a3)=0.26,P(a4)=0.05,P(a5)=0.50

(a)计算这个信源的熵。（b）求这个信源的霍夫曼码。（c）求（b）中代码的平均长度及其冗余度。

解：

(a). H=0.15*0.41+0.04*0.186+0.26*0.505+0.05*0.216+0.50*0.5=1.82(bits)

(b). 霍夫曼码如下表所示：

符号	编码
a1	000
a2	0011
a3	01
a4	0010
a5	1

(c).

平均长度L=3*0.15+4*0.04+2*0.26+4*0.05+1*0.5=1.83(bits/symbol)

所以冗余度=L-H=0.01

5.一个符号集A={a1,a2,a3,a4}，其概率为P(a1)=0.1,P(a2)=0.3,P(a3)=0.25,P(a4)=0.35，使用以下过程找出一种霍夫曼码：

(a)本章概述的第一种过程；

(b)最小方差过程。解释这两种霍夫曼码的区别。

解：

(a).

<1>：写出所有符号的概率；对所有符号按其概率从小到大排序；

<2>：在最小的的码字前加‘0’，在第二小的码字前加‘1’；

<3>：对划分得到的两个子集递归编码，直到每个集合不能被再划分；

得下表：

符号	编码
a1	000
a2	01
a3	001
a4	1

(b).

同(a)的算法，只是选择方差小的进行编码，所以编码为：

符号	编码
a1	00
a2	01
a3	10
a4	11

平均码长：L=2*0.1+2*0.3+2*0.25+2*0.35=2

由第一种过程方差得S²=0.1(3-2)²+0.3(2-2)²+0.25(3-2)²+0.35(1-2)² =0.70

由第二种过程方差得：S²=0.1(2-2)²+0.3(2-2)²+0.25(2-2)²+0.35(2-2)²=0

所以，最小方差树是第二种。

二、参考书《数据压缩导论（第4版）》Page 30

6.在本书配套的数据中有几个图像和语音文件。

(a) 编写一段程序，计算其中一些图像和语音文件的一阶熵。

(b) 选择一个图像文件，计算其二阶熵。试解释一阶熵与二阶熵的差别。

解：

(a).

图像文件的一阶熵：

EARTH.IMG是4.770801

OMAHA.IMG是6.942426

SENA.IMG是6.834299

SENSIN.IMG是7.317944

音频文件的一阶熵：

GABE.RAW是7.116338

BERK.RAW是7.151537

(b).

音频文件BERK.RAW的二阶熵是6.705169

结合(a)发现，一阶熵和二阶熵的差别二阶熵明显比一阶熵小很多。

(c).

音频文件 BERK.RAW的差熵是8.978236

从结果中可以看出，音频文件的差分熵比一阶熵和二阶熵都要大。

转载于:https://www.cnblogs.com/bojack/p/4784751.html

weixin_30507269

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第二次作业

一、参考书《数据压缩导论（第4版）》 Page 662.利用程序huff_enc和huff_dec进行以下操作（在每种情况下，利用由被压缩图像生成的码本）。(a)对Sena,Sensin和Omaha图像进行编码。文件名源文件大小（kb）压缩后大小（kb）压缩比Sena64　　5789.06%OMAHA645...
复制链接

扫一扫