压缩文件的扩展名有LZH和ZIP等,当文件太大,无法放入软盘中时,或将大附件添加到电子邮箱时,都会采取压缩的方式,将照片保存在计算机上时,也可能使用了JPEG等压缩格式
6.1 文件以字节为单位保存
文件是将数据存储在磁盘等存储媒介中的一种形式,程序文件中存储数据的单位是字节,文件就是字节数据的集合。如果文件中存储的数据是文字,那么文件就是文本文件,如果是图形,那么该文件就是图像文件
文件中的字节数据都是连续存储的

6.2 RLE算法的机制
RLE算法 行程长度编码算法:把文件内容用 数据*重复次数的形式来表示的压缩方法
RLE是一种很好的算法,常用与压缩传真等图像

6.3 RLE算法的缺点
然而在实际的文本文件中,同样字符多次重复出现的情况并不多见,虽然对于相同数据经常连续出现的图像,文件等,RLE算法可以发挥不错的效果,但它并不适合文本文件的压缩

对于存储着“This is a pen”这14个字符的文本文件来说,使用RLE算法对其进行压缩后,就变成了 T1h1i1s1 1ils1 1a1 1p1e1n1 这样28个字符,反而是压缩前的两倍
由于EXE文件和图像文件中连续的数据部分较多,RLE算法有显著压缩效果,但文本中字符大量连续出现的情况并不多见
6.4 通过莫尔斯编码看哈夫曼算法
6.5 用二叉树实现哈夫曼编码

6.6 哈夫曼算法能大幅提升压缩比率
LHA:日本常用的压缩软件,使用哈夫曼算法

6.7 可逆压缩和非可逆压缩
Windows的标准图像数据形式是BMP 位图,是完全未压缩的
除了BMP格式外,还有其他的图像数据形式,如JPEG,TIFF,GIF等格式,与BMP不同的是,这些图像数据都会用一些算法对数据进行压缩
把能够还原到压缩状态之前的压缩称为可逆压缩,无法还原到压缩状态之前的压缩称为非可逆压缩

9636

被折叠的 条评论
为什么被折叠?



