介绍几个常见的压缩算法

(一) 字典算法
  字典算法是最为简单的压缩算法之一。它是把文本中出现频率比较多的单词或词汇组合做成一个对应的字典列表,并用特殊代码来表示这个单词或词汇。例如:
  有字典列表:
  00=Chinese
  01=People
  02=China
  源文本:I am a Chinese people,I am from China 压缩后的编码为:I am a 00 01,I am from 02。压缩编码后的长度显著缩小,这样的编码在SLG游戏等专有名词比较多的游戏中比较容易出现,比如《SD高达》。
(二) 固定位长算法(Fixed Bit Length Packing)
  这种算法是把文本用需要的最少的位来进行压缩编码。
比如八个十六进制数:1,2,3,4,5,6,7,8。转换为二进制为:00000001,00000010,00000011,00000100,00000101,00000110,00000111,00001000。每个数只用到了低4位,而高4位没有用到(全为0),因此对低4位进行压缩编码后得到:0001,0010,0011,0100,0101,0110,0111,1000。然后补充为字节得到:00010010,00110100,01010110,01111000。所以原来的八个十六进制数缩短了一半,得到4个十六进制数:12,34,56,78。
这也是比较常见的压缩算法之一。

(三) RLE算法
  这种压缩编码是一种变长的编码,RLE根据文本不同的具体情况会有不同的压缩编码变体与之相适应,以产生更大的压缩比率。

  变体1:重复次数+字符
文本字符串:A A A B B B C C C C D D D D,编码后得到:3 A 3 B 4 C 4 D。

  变体2:特殊字符+重复次数+字符
文本字符串:A A A A A B C C C C B C C C,编码后得到:B B 5 A B B 4 C B B 3 C。编码串的最开始说明特殊字符B,以后B后面跟着的数字就表示出重复的次数。

  变体3:把文本每个字节分组成块,每个字符最多重复 127 次。每个块以一个特殊字节开头。那个特殊字节的第 7 位如果被置位,那么剩下的7位数值就是后面的字符的重复次数。如果第 7 位没有被置位,那么剩下 7 位就是后面没有被压缩的字符的数量。例如:文本字符串:A A A A A B C D E F F F。编码后得到:85 A 4 B C D E 83 F(85H= 10000101B、4H= 00000100B、83H= 10000011B)

  以上3种不RLE变体是最常用的几种,其他还有很多很多变体算法,这些算法在Winzip Winrar这些软件中也是经常用到的。

(四) LZ77算法
  LZ77算法是由 Lempel-Ziv 在1977发明的,也是GBA内置的压缩算法。LZ77算法有许多派生算法(这里面包括 LZSS算法)。它们的算法原理上基本都相同,无论是哪种派生算法,LZ77算法总会包含一个动态窗口(Sliding Window)和一个预读缓冲器(Read Ahead Buffer)。动态窗口是个历史缓冲器,它被用来存放输入流的前n个字节的有关信息。一个动态窗口的数据范围可以从 0K 到 64K,而LZSS算法使用了一个4K的动态窗口。预读缓冲器是与动态窗口相对应的,它被用来存放输入流的前n个字节,预读缓冲器的大小通常在0 – 258 之间。这个算法就是基于这些建立的。用下n个字节填充预读缓存器(这里的n是预读缓存器的大小)。在动态窗口中寻找与预读缓冲器中的最匹配的数据,如果匹配的数据长度大于最小匹配长度 (通常取决于编码器,以及动态窗口的大小,比如一个4K的动态窗口,它的最小匹配长度就是2),那么就输出一对〈长度(length),距离(distance)〉数组。长度(length)是匹配的数据长度,而距离(distance)说明了在输入流中向后多少字节这个匹配数据可以被找到。

  例如:(假设一个 10个字节的动态窗口, 以及一个5个字节的预读缓冲器)
文本:A A A A A A A A A A A B A B A A A A A
--------------------- =========
动态窗口 预读缓存器
动态窗口中包含10个A ,这就是最后读取的10个字节。预读缓冲器包含了 B A B A A。编码的第一步就是寻找动态窗口与预读缓存器相似长度大于2的字节部分。在动态窗口中找不到B A B A A,所以B就被按照字面输出。然后动态窗口滑过1个字节,现在暂时输出了一个B。
第二步:A A A A A A A A A A A B A B A A A A A
--------------------- =========
动态窗口 预读缓存器
现在预读缓冲器包含A B A A A,然后再和动态窗口进行比较。这时,在动态窗口找到了相似长度为2的A B,因此一对〈长度, 距离〉就被输出了。长度(length)是2 并且向后距离也是2,所以输出为<2,2>,然后动态窗口滑过2个字节。现在已经输出了B <2,2>。
第三步:A A A A A A A A A A A B A B A A A A A
--------------------- =========
动态窗口 预读缓存器
继续上面的方法得到输出结果<5,8>。现在已经输出了B <2,2> <5,8>。
最终的编码结果是:A A A A A A A A A A A B <2,2> <5,8>。
但数组是无法直接用二进制来表示的,LZ77会把编码每八个数分成一组,每组前用一个前缀标示来说明这八个数的属性。比如数据流:A B A C A C B A C A按照LZ77的算法编码为:A B A C<2,2> <4,5>,刚好八个数。按照LZ77的规则,用“0”表示原文输出,“1”表示数组输出。所以这段编码就表示为:00001111B(等于0FH),因此得到完整的压缩编码表示:F A B A C 2 2 4 5。虽然表面上只缩短了1个字节的空间,但当数据流很长的时候就会突出它的优势,这种算法在zip格式中是经常用到。

  除此之外还有很多压缩算法,像霍夫曼编码(Huffman Encoding)等等。这些编码也是非常的著名而且压缩效率极高,不过这些编码的算法相对比较繁琐,规则也很复杂,由于篇幅就不逐一介绍了。如果大家对这方面感兴趣可以到网站相关网站查询资料。

  小结:这一节介绍的几种算法在GBA上是比较容易遇到的典型算法,但绝不是说只有这几种,还是有很多时候都得自己ASM跟踪进行分析,这里介绍给大家希望能拓展大家的思维,方便进行程序分析,对于一切的问题ASM才是万能的。 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: MATLAB是一种强大的数学计算软件,可以用于处理和分析大量的数据。数据压缩是一种减少数据量的操作,可以减少存储空间和数据传输的时间。MATLAB提供了许多数据压缩算法,可以用于压缩各种类型的数据。 其中一个常用的数据压缩算法是Huffman编码。Huffman编码是一种无损压缩算法,通过统计字符出现的频率来生成一个最优的编码表。根据频率的不同,频率高的字符使用较短的编码,频率低的字符使用较长的编码。通过使用这个编码表,原始数据可以转换成压缩数据。MATLAB中提供了huffmandict函数用于生成Huffman编码表,以及huffmanenco和huffmandeco函数用于进行编码和解码。 除了Huffman编码,MATLAB还提供了其他的数据压缩算法,例如Lempel-Ziv-Welch (LZW)压缩算法和Run-Length Encoding (RLE)压缩算法。LZW压缩算法是一种字典压缩算法,通过构建和更新压缩字典来实现数据压缩。RLE压缩算法则是一种简单的无损压缩算法,将连续相同的字符替换为一个字符和计数值。这些算法都可以在MATLAB中使用,可以根据需要选择适当的压缩算法。 综上所述,MATLAB提供了多种数据压缩算法,包括Huffman编码、LZW压缩算法和RLE压缩算法等。这些算法可以帮助用户减少数据量,提高数据存储和传输的效率。用户可以根据自己的需求选择适当的压缩算法,并利用MATLAB中提供的相关函数进行数据压缩操作。 ### 回答2: MATLAB数据压缩算法是一种用于减小数据文件大小并减少存储/传输成本的技术。它通过使用各种压缩技术来减少数据的冗余和重复,从而实现数据压缩。 MATLAB提供了几种数据压缩算法,包括无损压缩和有损压缩。无损压缩算法通过删除冗余数据和使用编码技术来压缩数据,而不会丢失任何信息。有损压缩算法使用一些启发式方法,通过牺牲一些细节信息来提供更高的压缩率。 常见的无损压缩算法包括Lempel-Ziv-Welch(LZW)、哈夫曼编码、算术编码等。LZW算法基于字典的编码,通过逐步建立和更新字典来实现数据压缩。哈夫曼编码则根据字符出现的频率来为每个字符分配唯一的编码。算术编码使用概率分布来为整个消息分配单个编码。 有损压缩算法常用于图像、音频和视频压缩。这些算法可以通过删除某些不重要的信息来降低数据量。例如,JPEG算法使用离散余弦变换(DCT)和量化技术来减小图像文件大小。这种压缩方法会丢失一些图像细节,但可以在保持可接受质量的同时实现较高的压缩率。 综上所述,MATLAB数据压缩算法是一种通过删除冗余和重复数据来减小文件大小的技术。无损压缩算法可以保持数据的完整性,而有损压缩算法则可以实现更高的压缩率,但会丢失一些细节信息。根据所需的压缩率和数据的重要性,可以选择适合的压缩算法来满足特定需求。 ### 回答3: MATLAB数据压缩算法是一种用于数据压缩的算法,它可以将大量的数据压缩成较小的存储空间,以减少存储和传输的成本。MATLAB中有多种数据压缩算法可供选择,主要包括有损和无损的压缩方法。 有损压缩算法是一种通过舍弃数据的一些细节来减小数据量的方法。它适用于一些对数据的高精度要求不那么严格的场景。常见的有损压缩算法有JPEG和MP3等。在MATLAB中,可以使用imwrite函数将图像数据通过JPEG算法进行压缩,也可以使用audiowrite函数将音频数据通过MP3算法进行压缩。 无损压缩算法是一种通过利用数据的统计性质和冗余性来减小数据量的方法。它适用于对数据精度要求较高的情况。常见的无损压缩算法有ZIP和LZW等。在MATLAB中,可以使用zip函数将数据打包为ZIP格式进行压缩,也可以使用lzwencode函数将数据使用LZW算法进行压缩。 除了以上介绍常见压缩算法,MATLAB还提供了一些专门用于特定数据类型的压缩算法。例如,对于稀疏矩阵数据,可以使用sparse函数将其转化为稀疏矩阵格式,以减小存储空间的占用。对于时间序列数据,可以使用timeseries对象进行压缩和存储。 总之,MATLAB提供了多种数据压缩算法,可以根据实际的需求选择合适的压缩方法。无论是有损还是无损压缩,都可以通过MATLAB来实现数据的高效存储和传输。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值