再谈香浓熵:编码与信息量

本文深入探讨了香浓熵在信号编码中的作用,阐述了如何根据随机变量的取值和概率进行编码优化。从唯一取值到多值随机变量,再到考虑概率的编码策略,通过实例展示了如何通过香浓熵计算最小编码长度,从而降低信息传输的成本。
摘要由CSDN通过智能技术生成

接上篇:理解香浓熵

信号编码

香浓熵的妙处在于其数值描述了一个随机变量的需要最佳(二进制)编码长度(bit 位数)。

唯一取值随机变量

极端情况:某个随机变量永远输出唯一单一的值。就像上篇中的收音机,永远输出440Hz的音。
那么根本不需要编码,我们“闭着眼睛”都知道这个值。编码所需长度为0。

二值随机变量

如果随机变量有两个可能的值,比如440Hz 与 261Hz的音。
那么如果我们要告诉别人现在实际的值是哪个,至少需要 1 1 1位二进制编码:0或1。

N值随机变量

一般的,如果有 n n n个值,如果用二进制,则需要约 l o g 2 n log_2n log2n位编码。
比如8个值,需要 l o g 2 8 log_2{8} log28=3位。编码:000, 001, …110, 111。
如果不是2的整次幂,则向上取整即可。
比如11个值, l o g 2 11 ≈ 3.46 log_2{11} \approx 3.46 log2113.46,需要4位编码,有些码用不上,会浪费掉;但没办法,3位不够。

编码优化

以上都没有考虑各个取值的概率。
考虑上概率,则可以优化。
比如4个值的情况,假设值 x 1 x_1 x1出现的概率为70%,其它3个值的概率都为10%。
那么可以这样编码:
x 1 x_1 x1: 0
x 2 x_2 x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值