多媒体技术相关压缩算法

最新推荐文章于 2019-01-17 17:05:10 发布

为你谱写音符

最新推荐文章于 2019-01-17 17:05:10 发布

阅读量1.9k

点赞数 1

分类专栏：个人总结文章标签：香农编码哈夫曼编码算术编码游程编码 LZW

本文链接：https://blog.csdn.net/weizheng1000/article/details/50542243

版权

个人总结专栏收录该内容

26 篇文章 0 订阅

订阅专栏

1、香农编码

这个例子展示了一组字母的香浓编码结构（如图a所示）这五个可被编码的字母有如下出现次数:

Symbol	A	B	C	D	E
Count	15	7	6	6	5
Probabilities	0.38461538	0.17948718	0.15384615	0.15384615	0.12820513

从左到右，所有的符号以它们出现的次数划分。在字母B与C之间划定分割线，得到了左右两组，总次数分别为22,17。这样就把两组的差别降到最小。通过这样的分割, A与B同时拥有了一个以0为开头的码字, C，D，E的码子则为1,如图b所示。随后, 在树的左半边，于A，B间建立新的分割线，这样A就成为了码字为00的叶子节点，B的码子01。经过四次分割, 得到了一个树形编码。如下表所示，在最终得到的树中, 拥有最大频率的符号被两位编码, 其他两个频率较低的符号被三位编码。

符号	A	B	C	D	E
编码	00	01	10	110	111

2、哈夫曼编码

3、算术编码(理解即可)

算术编码的基本原理是将编码的消息表示成实数0和1之间的一个间隔（Interval），消息越长，编码表示它的间隔就越小，表示这一间隔所需的二进制位就越多。

算术编码用到两个基本的参数：符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率，也决定编码过程中信源符号的间隔，而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。

给定事件序列的算术编码步骤如下：

（1）编码器在开始时将“当前间隔” [ L， H) 设置为[0，1)。

（2）对每一事件，编码器按步骤（a）和（b）进行处理

　　（a）编码器将“当前间隔”分为子间隔，每一个事件一个。

　　（b）一个子间隔的大小与下一个将出现的事件的概率成比例，编码器选择子间隔对应于下一个确切发生的事件相对应，并使它成为新的“当前间隔”。

（3）最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。

例1：假设信源符号为{A， B， C， D}，这些符号的概率分别为{ 0.1， 0.4， 0.2，0.3 }，根据这些概率可把间隔[0， 1]分成4个子间隔：[0， 0.1]， [0.1， 0.5]， [0.5， 0.7]， [0.7， 1]，其中[x，y]表示半开放间隔，即包含x不包含y。上面的信息可综合在表03-04-1中。

表03-04-1 信源符号，概率和初始编码间隔

符号	A	B	C	D
概率	0.1	0.4	0.2	0.3
初始编码间隔	[0， 0.1)	[0.1， 0.5)	[0.5， 0.7)	[0.7， 1]

如果二进制消息序列的输入为：C A D A C D B。编码时首先输入的符号是C，找到它的编码范围是[0.5，0.7]。由于消息中第二个符号A的编码范围是[0， 0.1]，因此它的间隔就取[0.5， 0.7]的第一个十分之一作为新间隔[0.5，0.52]。依此类推，编码第3个符号D时取新间隔为[0.514， 0.52]，编码第4个符号A时，取新间隔为[0.514， 0.5146]，…。消息的编码输出可以是最后一个间隔中的任意数。整个编码过程如图03-04-1所示。

图03-04-1 算术编码过程举例

这个例子的编码和译码的全过程分别表示在表03-04-2和表03-04-3中。

表03-04-2 编码过程

步骤	输入符号	编码间隔	编码判决
1	C	[0.5， 0.7]	符号的间隔范围[0.5， 0.7]
2	A	[0.5， 0.52]	[0.5， 0.7]间隔的第一个1/10
3	D	[0.514， 0.52]	[0.5， 0.52]间隔的最后一个1/10
4	A	[0.514， 0.5146]	[0.514， 0.52]间隔的第一个1/10
5	C	[0.5143，0.51442]	[0.514， 0.5146]间隔的第五个1/10开始，二个1/10
6	D	[0.514384，0.51442]	[0.5143， 0.51442]间隔的最后3个1/10
7	B	[0.5143836，0.514402]	[0.514384，0.51442]间隔的4个1/10，从第1个1/10开始
8	从[0.5143876， 0.514402]中选择一个数作为输出：0.5143876

表03-04-3 译码过程

步骤	间隔	译码符号	译码判决
1	[0.5， 0.7]	C	0.51439在间隔 [0.5， 0.7)
2	[0.5，0.52]	A	0.51439在间隔 [0.5， 0.7)的第1个1/10
3	[0.514，0.52]	D	0.51439在间隔[0.5， 0.52)的第7个1/10
4	[0.514，0.5146]	A	0.51439在间隔[0.514， 0.52]的第1个1/10
5	[0.5143，0.51442]	C	0.51439在间隔[0.514， 0.5146]的第5个1/10
6	[0.514384，0.51442]	D	0.51439在间隔[0.5143， 0.51442]的第7个1/10
7	[0.51439，0.5143948]	B	0.51439在间隔[0.51439，0.5143948]的第1个1/10
8	译码的消息：C A D A C D B