信息论复习—信源编码的基本方法

目录

信源编码的目的:提高传输效率 

离散信源:

离散信源的分类:

离散无记忆信源 (DMS: Discrete Memoryless Source)

离散无记忆信源的特点:

离散无记忆信源编码与译码:

等长编码的编码速率:

不等长编码的编码速率:

信源的熵H(S ),与编码速率 R 的比值定义为编码效率

离散无记忆信源的等长编码:

等长编码:对信源的每个符号,或每组符号,用长度相等的代码来表示:

扩展编码(联合编码):将 J 个信源符号进行联合编码:

离散无记忆信源(DMS)的有损等长编码:

定义:典型序列集

信源划分定理:

可达速率:

离散无记忆信源的不等长编码:

不等长编码的唯一可译性:

逗点码 —见到逗号就识别为一个码字的开始:

异字头码 — 见到一个码字就立即识别:

码树:

异字头码(编码):

不等长编码的基本定理:

​例:

霍夫曼(Huffman)编码:

霍夫曼编码的步骤:

例:

​编辑​编辑 码字长度的均匀性和方差:


信源编码的目的:提高传输效率 

(1)去除消息中的冗余度,使传输的符号尽可能都是独立的,没有多余的成分(如语音、图像信号压缩)

(2)使传输的符号所含的信息最大化。例如,通过编码使符号以等概分布的形式出现,使每个符号可能携带的信息量达到最大;

(3)采用不等长编码,让出现概率大的符号用较短的码元序列表示,对概率小的符号用较长的码元序列;

  (4)  允许一定失真的条件下,如何实现高效率的编码。


离散信源:

离散无记忆信源:

所发出的各个符号之间是相互独立的,发出的符号序列中的各个符号之间没有统计关联性,各个符号的出现概率是它自身的先验概率。

离散有记忆信源:

发出的各个符号之间不是相互独立的,各个符号出现的概率是有关联的。

发出单个符号的离散信源:

信源每次只发出一个符号代表一个消息;

发出符号序列的离散信源:

信源每次发出一组含两个以上符号的符号序列代表一个消息。

将以上两种分类结合,就有四种离散信源:

(1)发出单个符号的无记忆离散信源;

(2)发出符号序列的无记忆离散信源;

(3)发出单个符号的有记忆离散信源;

(4)发出符号序列的有记忆离散信源。


离散信源的分类:

单个符号的离散信源:每次只发出一个符号代表一个消息,且消息数量有限

发出符号序列离散信源--每次发出一组含两个以上的符号序列来代表一个消息

实例:


离散无记忆信源 (DMS: Discrete Memoryless Source):

 

离散无记忆信源的特点:

信源发出的各符号之间相互独立

发出的符号序列中各个符号之间没有统计关联性

各个符号的出现概率是它自身的先验概率

离散无记忆信源编码与译码:

对信源的每个不同的符号或不同的符号序列,编码后产生的码字不同,则称该码为唯一可译码

待编码码组简单记为:

编码输出码组(码字)为:

编码进制:D

码元位数:n

信源种类:L(有L种不同的符号)

J个符号为一组编码

待编码的符号序列的不同组合个数为:

码字集中不同的码字个数:

编码输出为唯一可译码的(必要)条件:

对于码元取自码字长度为一个码字

其最大可携带的信息量为


定义:编码表示一个信源符号所需的平均信息量的定义为编码速率 R

码字长度为常数的编码称为等长编码,反之称为不等长编码。对长度为 J  的信源符号序列进行编码:

等长编码的编码速率:

不等长编码的编码速率:

其中为不等长编码的平均码长


信源的H(S ),与编码速率 R 的比值定义为编码效率

要保证编码没有信息丢失,要求


离散无记忆信源的等长编码:

等长编码:对信源的每个符号,或每组符号,用长度相等的代码来表示:

单个符号独立编码 ,采用D制码元编码,若信源符号集有 L 种符号,要保证译码的唯一性

扩展编码(联合编码)J 个信源符号进行联合编码:


离散无记忆信源(DMS)的有损等长编码:

无损的等长编码,往往会因为 J 的取值过大,难以实际应用

定义:典型序列集

信源划分定理:

 

典型序列集是一个高概率集,但其数目在整个序列空间中可能只占很小的比例

例题:

可达速率:

例题:


离散无记忆信源的不等长编码:

不等长编码的唯一可译性:

1)每个消息都至少有一个码字与之对应,且不同的消息对应不同的码字

2) 对于一个码,如果存在一种译码方法,使任意若干个码字所组成的字母串只能唯一地被翻译成这几个码字所对应的事件序列,即码字的分点唯一确定。


逗点见到逗号就识别为一个码字的开始:

若 ①事件与码字一一对应;

     ②每个码字的开头部分都是一个相同的字母串;

     ③这个字母串仅仅出现在码字的开头,不出现在码字的其它部位。则称这个字母串为逗号,称此码为逗点码

异字头见到一个码字就立即识别:

若①事件与码字一一对应;

    ②每个码字都不是另一个码字的开头部分(字头)。

称此码为异字头码

码树:

异字头码(编码):

异字头码的优点:异字头码译码时具有即时性,即当收到一个完整的码字后即可译码,不用担心这一码字是另一码字的字头部分。


不等长编码的基本定理:

 

 例题:

 


霍夫曼(Huffman)编码:

霍夫曼编码是一种异字头不等长编码,其基本思想是:对出现概率大的符号或符号组用位数较少的码字表示;对出现概率小的符号或符号组用位数较多的码字表示。由此可提高编码效率。

霍夫曼编码一种最佳的不等长编码。

霍夫曼编码的步骤:

例:

 码字长度的均匀性和方差:

在同样的平均码字长度的情况下,码字长度越均匀,对传输越有利

编码过程的排序过程不同影响码长的方差。

在编码过程中,当对缩减信源概率重新排列时,应使合并得到的局部概率和尽量使其处于最高位置;使得合并元素重复编码的次数减少,有利于降低码字长度的方差

  • 8
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Vizio<

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值