香农编码基于C语言上的实现
香农编码基于C语言上的实现
摘 要
编码是指为了达到某种目的而对信号进行的一种变换。根据编码的目的不同,编码理论有三个分支:①信源编码。对信源输出的信号进行变换,包括连续信号的离散化,即将模拟信号通过采样和量化变成数字信号,以及对数据进行压缩,提高数字信号传输的有效性而进行的编码。②信道编码。对信源编码器输出的信号进行再变换,包括区分通路、适应信道条件和提高通信可靠性而进行的编码。③保密编码。对信道编码器输出的信号进行再变换,即为了使信息在传输过程中不易被人窃取而进行的编码。编码理论在数字化遥测遥控系统、电气通信、数字通信、图像通信、卫星通信、深空通信、计算技术、数据处理、图像处理、自动控制、人工智能和模式识别等方面都有广泛的应用。1951年美国电信工程师D.A.霍夫曼提出更有效的霍夫曼编码。此后又出现了传真编码、图像编码和话音编码,对数据压缩进行了深入的研究,解决了数字通信中提出的许多实际问题。在信源编码方面,1951年香农证明,当信源输出有冗余的消息时可通过编码改变信源的输出,使信息传输速率接近信道容量。1948年香农就提出能使信源与信道匹配的香农编码。f,它把信源输出的符号ui变换成码元序列wi。
f:ui——>wi,i=1,2,…,q
信源编码定义如图2.1:
凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合都可以称为最佳码。为此必须将概率大的信息符号编以短的码字,概率小的符号编以长的码字,使得平均码字长度最短。能获得最佳码的编码方法主要有:香农(Shannon)、费诺(Fano)、哈夫曼(Huffman)编码等。[2]
2.2 香农编码原理
香农第一定理指出了平均码长与信源之间的关系,同时也指出了可以通过编码使平均码长达到极限值,这是一个很重要的极限定理。如何构造这种码?香农第一定理指出,选择每个码字的长度Ki满足下式
I(xi)≤K﹤I(xi)+1,
就可以得到这种码。这种编码方法就是香农编码。
2.3 编码步骤
香农编码法冗余度稍大,实用性不大,但有重要的理论意义。编码步骤如下:
将信源消息符号按其出现的概率大小依次排列
p(x1)≥p(x2)≥…≥p(xn)
确定满足下列不等式整数码长Ki:
-log2p(xi)≤Ki<-log2p(xi)+1
为了编成唯一可译码,计算第i个消息的累加概率
Pi=p(xk)
将累加概率Pi变成二进制数。
取Pi二进制数的小数点后Ki位即为该消息符号的二进制码字。
香农编码的算法介绍
3.1 C语言算法介绍
C语言是目前世界上流行,使用最广泛的高级程序设计语言C是结构式语言结构式语言的显著特点是代码及数据的分隔化,即程序的各个部分除了必要的信息交流外彼此独立.这种结构化方式可使程序层次清晰, 便于使用,维护以及调试.C语言是以函数形式提供给用户的,这些函数可方便的调用,并具有多种循环,条件语句控制程序流向,从而使程序完全结构化.#include
#include
#include
#define max_CL 10
#define max_PN 6
typedef float datatype;
typedef struct SHNODE
{
datatype pb; /*第i个消息符号出现的概率*/
datatype p_sum; /*第i个消息符号累加概率*/
int kl; /*第i个消息符号对应的码长*/
int code[max_CL]; /*第i个消息符号的码字*/
struct SHNODE *next;
}
shnolist;
datatype sym_arry[max_PN]; /*序列的概率*/
void pb_scan(); /*得到序列概率*/
void pb_sort(); /*序列概率排序*/
由程序可以看出代码长度的最大值为10,序列个数位6。其中还定义了消息符号出现的概率,累加概率等计算香农编码时所必须的数值。
计算编码时,需要计算的几个符号的出现概率总和应为1,当大于或小于1时,则是错误的,不能进行香农编码,所以,程序应可以对概率总和是否等于1进行判断。即如下程序:
if(sum>1.0001||sum<0.99)
{ printf("sum=%f,sum must (<0.999
pb_sc