一. 数据的冗余()
1. 冗余(视觉系统的敏感度有限,人最多可辩认出种颜色,而色彩图像一般每个像素用24位表示,即可表示种颜色):
- 空间冗余:视频图像通常与他周围的某些像素在亮度和色彩上相同或非常相近,存在一定相关性
- 时间冗余:运动图像中,相邻两帧图像之间有较大的相关性
- 信息熵冗余:一个图像的灰度级编码使用了多于实际需要的编码符号
- 结构冗余:图像存在的纹理或图元的相似结构
- 知识冗余:一些图像理解问题与某些先验知识有着相当大的相关性。根据已有的知识,对某些图像中所包含的物体,可以构造其基本模型,并创建对应各种特征的图像库,进而图像的存储只需要保存一些特征参数,从而大大减少数据量。知识冗余是模型编码的基础
- 视觉冗余:人类视觉系统对亮度变化敏感,而对色度变化相对不敏感,在高亮区,人眼对亮度变化敏感度下降,只是对内部细节相当不敏感,而对整体轮廓敏感。
2. 信息论几个基本术语
决策量:事件的对数
信息量:具有确定概率事件的信息的定量度量
熵(非冗余的,不可压缩的信息量,数据压缩的理论极限):事件的信息量的平均值
3. 冗余量=决策量-熵
基本思想:概率高的符号用短码,概率低的符号用长码
二. 统计编码(熵编码,最佳信源编码)
基于统计的数据压缩方法,利用香农理论,从统计角度,设法找到一种编码,使平均码长达到熵极限
数据压缩的分类:
- 无损压缩编码(可逆编码):算法中删除的仅仅是数据中冗余的信息,因此解压缩时能精确恢复原数据。信息没有损失
- 有损压缩编码(不可逆编码):算法把不相干的信息删除,允许重构数据与原始数据存在一定误差。因此只能对原始图像近似重建,不能精确复原
主要方法:
- 霍夫曼编码:根据符号集合中各符号出现的频繁程度编码,次数越多,代码位数越短。
局限:没有错误保护功能;由于是变长编码,所以很难任意查找或调用压缩文件中内容
编码步骤:1. 把符号按出现概率从大到小排列
2. 把两个最小的概率加起来作为新符号概率
3. 重复步骤1,2,直到概率和达到1
4. 在每次合并符号时,被合并的符号赋值1和0,大1小0
5. 寻找路径,记录1、0
6. 从树根到信号源符号节节排序
- 算术编码:用0和1之间的实数的间隔长度代表概率大小,概率越大,间隔越长