理解熵(信息熵,交叉熵,相对熵)

Highlights:

1)信息熵:编码方案完美时,最短平均编码长度的是多少。
2)交叉熵:编码方案不一定完美时(由于对概率分布的估计不一定正确),平均编码长度的是多少。
平均编码长度 = 最短平均编码长度 + 一个增量
3)相对熵:编码方案不一定完美时,平均编码长度相对于最小值的增加值。(即上面那个增量)

信息熵

1、熵的本质是香农信息量 log(1/p) 的期望;(参考了第一个答案)

H(p)=E[log(1/p)]=pilog(1/pi)

是一个期望的计算,也是记录随机事件结果的平均编码长度;
为什么信息量 是 log(1/p) 呢?
因为:一个事件结果的出现概率越低,对其编码的bit长度就越长。 以期在整个随机事件的无数次重复试验中,用最少的 bit 去记录整个实验历史。即无法压缩的表达,代表了真正的信息量。
2、熵的本质的另一种解释:最短平均编码长度;
本质含义:编码方案完美时,最短平均编码长度的是多少
3、交叉熵,则可以这样理解:使用了“估算”的编码后,得到的平均编码长度(可能不是最短的)p是真实概率分布,q是你以为的概率分布(可能不一致);你以 q 去编码,编码方案 log(1/q_i)可能不是最优的;于是,平均编码长度 = ∑ p_i *log(1/q_i),就是交叉熵;只有在估算的分布 q 完全正确时,平均编码长度才是最短的,交叉熵 = 熵

交叉熵

1.定义
本质含义:编码不一定完美时,平均编码长度是多少
连续函数:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值