数据压缩

第一次作业
习题与思考题
1-1

答案:
首先,一个基本问题“我们要压缩什么”我们想到的就是要压缩“文件”

对于数据压缩我认为就是对原始数据进行数据编码或压缩编码。
1-2
答案:
进行压缩文件有几大用处:
1、方便数据流通。
2、节省磁盘空间。
3、形成压缩包的时候添加解压密码,这样生成的压缩包别人没有密码是无法打开的,可以起到一定的文件保密作用。
4、
压缩文件本身没有防病毒机制。用压缩包恢复被损坏文件只是一种备份机制。同时靠压缩包防病毒并不可靠,因为压缩包同样能感染病毒。
1-6
答案:
数据压缩技术
分为压缩技术和不可逆压缩
数据压缩的分类方法很多,数据压缩的一般步骤:原始数据
建模表达模型参数二次量化量化符号编码压缩码流

参考书《数据压缩导论(第4版)》Page 8
1、用你的计算机上的压缩工具来压缩不同文件。研究原文件的大小和类型对于压缩文件与原文件大小之比的影响。
答案:我在计算机上用压缩工具来压缩不同文件。压缩比则根据文件类型的不同有所不同,比如文档类的文件压缩比很大(一个字或者一个词在同一个文件会反复出现),
而影音文件的压缩比则比较小(每一个像素点的色素不同是常有的,不同颜色和颜色深浅、对比度的不同、亮度不同、音调音色不同等的对应二进制代码是不同的)。 
 
2、从一本通俗杂志中摘录几段文字,并删除所有不会影响理解的文字,实现压缩。例如,在“This is the dog that belongs to my friend”中,
删除is、the、that和to之后,仍然能传递相同的意思。用被删除的单词数与原文本的总单词数之比来衡量文本中的冗余度。
用一本技术期刊中的文字来重复这一试验。对于摘自不同来源的文字,我们能否就其冗余度做出定量论述?
答案:对于摘自不同来源的文字,不能否就其冗余度做出定量论述。重复这一试验,不同文本中的冗余度是不一样的。信息存在冗余。


第二次作业
 参考书《数据压缩导论(第4版)》Page 30
3、给定符号集A={a1,a2,a3,a4},求以下条件下的一阶熵:
(a)P(a1)=P(a2)=P(a3)=P(a4)=1/4
H=2(bit)
(b)P(a1)=1/2 , P(a2)=1/4 , P(a3)=P(a4)=1/8 
H=1.75(bit)
(c)P(a1)=0.505 ,  P(a2)=1/4 , P(a3)=1/4 , P(a4)=0.12 
H=1.87(bit)
5、考虑以下序列:
                ATGCTTAACGTGCTTAACCTGAAGCTTCCGCTGAAGAACCTG
                CTGAACCCGCTTAAGCTTAAGCTGAACCTTCTGAACCTGCTT
(a)根据此序列估计各概率值,并计算这一序列的一阶、二阶、三阶和四阶熵。
P(A)=21/84=1/4; P(T)=23/84; P(G)=16/84=4/21; P(C)=24/84=2/7
阶熵:H=2
(b)根据这些熵,能否推断此序列具有什么样的结构?
7、做一个实验,看看一个模型能够多么准确地描述一个信源。
 (a)编写一段程序,从包括26个字母的符号集{a,b,...,z}中随机选择字母,组成100个四字母单词,这些单词
#include<iostream> 
using namespace std;
#include<cstdlib>
#include<ctime>
#include<iomanip>
void main()
{

}
 
 
 

 

 
 
 
 
 

转载于:https://www.cnblogs.com/Ray7/p/4759993.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值