理解熵(信息熵,交叉熵,相对熵)

最新推荐文章于 2023-08-16 11:48:09 发布

hellowin4_18th

最新推荐文章于 2023-08-16 11:48:09 发布

阅读量811

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xidiancxy/article/details/79653135

版权

Highlights:

1）信息熵：编码方案完美时，最短平均编码长度的是多少。
2）交叉熵：编码方案不一定完美时（由于对概率分布的估计不一定正确），平均编码长度的是多少。
平均编码长度 = 最短平均编码长度 + 一个增量
3）相对熵：编码方案不一定完美时，平均编码长度相对于最小值的增加值。（即上面那个增量）

信息熵

1、熵的本质是香农信息量 log(1/p) 的期望；（参考了第一个答案）

H (p) = E [l o g (1 / p)] = \sum p i * l o g (1 / p i) ，

$H(p) = E[ log(1/p) ] = ∑ p_i * log(1/p_i)，$
是一个期望的计算，也是记录随机事件结果的平均编码长度；
为什么信息量是 log(1/p) 呢？
因为：一个事件结果的出现概率越低，对其编码的bit长度就越长。以期在整个随机事件的无数次重复试验中，用最少的 bit 去记录整个实验历史。即无法压缩的表达，代表了真正的信息量。
2、熵的本质的另一种解释：最短平均编码长度；
本质含义：编码方案完美时，最短平均编码长度的是多少
3、交叉熵，则可以这样理解：使用了“估算”的编码后，得到的平均编码长度（可能不是最短的）p是真实概率分布，q是你以为的概率分布（可能不一致）；你以 q 去编码，编码方案 log(1/q_i)可能不是最优的；于是，平均编码长度 = ∑ p_i *log(1/q_i)，就是交叉熵；只有在估算的分布 q 完全正确时，平均编码长度才是最短的，交叉熵 = 熵

交叉熵

1.定义
本质含义：编码不一定完美时，平均编码长度是多少
连续函数：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。