bzip2原理分享

实现压缩

对数据进行压缩,通常有两个思路:

  1. 字典转换 ( dictionary transforms )
    减少数据中不同符号的数量(即让“字母表”尽可能小);【目前所有的主流压缩算法,比如GZIP或者7-Zip,都会在核心转换步骤中使用字典转换】
  2. 变长编码 (variable-length codes)
    用更少的位数对更常见的符号进行编码(即最常见的“字母”所用的位数最少)。【bzip2 基于该点对数据进行压缩】

bzip2 运行原理

wiki 描述
wiki 描述
wiki 描述
wiki 描述

在这里插入图片描述
数据解压为上述流程的逆过程。

BWT

Burrows–Wheeler变换(BWT,也称作块排序压缩),是一个被应用在数据压缩技术(如bzip2)中的算法。该算法于1994年被Michael Burrows和David Wheeler在位于加利福尼亚州帕洛阿尔托的DEC系统研究中心发明。它的基础是之前Wheeler在1983年发明的一种没有公开的转换方法。

BWT会打乱数据流中符号的顺序,并试图让相同的符号簇彼此靠近。
例如字符串S="BANANA"经过BWT后变成S 1 _1 1

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值