如何理解用信息熵来表示最短的平均编码长度

最新推荐文章于 2025-06-30 16:35:37 发布

Hearthougan

最新推荐文章于 2025-06-30 16:35:37 发布

阅读量1.3w

点赞数 15

CC 4.0 BY-SA版权

分类专栏： Machine Learning 文章标签：信息熵编码

本文链接：https://blog.csdn.net/hearthougan/article/details/77774948

Machine Learning 专栏收录该内容

28 篇文章

订阅专栏

本文通过几个实例解释了信息熵的概念及其与编码之间的联系，并详细介绍了如何利用Huffman编码减少平均编码长度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前弄明白了信息熵是什么，由于信息熵来源于信息论，要怎么才能跟编码联系起来呢？这个问题当时没有想明白，今天查了一下资料，理解了一下，做笔记整理一下，如有错误欢迎指正。

如果信息熵不明白的请看这里：http://blog.csdn.net/hearthougan/article/details/76192381

首先给出结果：

最短的平均编码长度 = 信源的不确定程度 / 传输的表达能力。

其中信源的不确定程度，用信源的熵来表示，又称之为被表达者，传输的表达能力，称之为表达者表达能力，如果传输时有两种可能，那表达能力就是，如果是传输时有三种可能，那表达能力就是。以例子来描述，尽量做到通俗易懂。

例1：昨天小明错过一场有8匹赛马的比赛，编号为1~8号，每匹马赢的概率都一样，那么作为朋友的你要把获胜马的编号发送给他，那么你该怎么做？

方法一：直接发送马的编号，这样描述一匹马需要3比特（000,001,010,011,100,101,110,111）。

方法二：利用数据结构中的Huffman编码，如下：

建立Huffman树：

由上图可知，当等概率的时候，发送信息仍至少需要3比特。

被表达者：直接根据概率求熵即可，1/8×log8 * 8 = 3比特。

表达者：由图可以看出来Huffman树是一颗二叉树，要么是0，要么是1，所以表达能力就是log2.

平均编码长度 = 3/log2 = 3比特，注意其中的log 都是以2为底的。

例2：昨天小明错过一场有8匹赛马的比赛，编号为1~8号，1~8号获胜的概率分别为{1/2、1/4、 1/8、 1/16、 1/64、 1/64、 1/64、 1/64}，那么作为朋友的你要把获胜马的编号发送给他，那么你该怎么做？

方法一：仍然直接发送马的编号，这样描述一匹马需要3比特（000,001,010,011,100,101,110,111）。

方法二：利用数据结构中的Huffman编码，如下：

建立Huffman树：

由于概率不相等，则根据Huffman树可知平均编码为：（1 × 1/2 + 2 × 1/4 + 3 × 1/8 + 4 × 1/16 + 6 × 1/64 + 6 × 1/64 + 6 × 1/64 + 6 × 1/64） = 2比特，当概率不相等的时候，发送的平均长度为2比特。

由上图可知：

被表达者（不确定程度）：

表达者：由图可以看出来Huffman树是一颗二叉树，要么是0，要么是1，所以表达能力就是log2.

平均编码长度：2/log2 = 2比特。

例3：假设有5个硬币：1,2,3,4,5，其中一个是假的，比其他的硬币轻。有一个天平，天平每次能比较两堆硬币，得出的结果可能是以下三种之一：
左边比右边轻
右边比左边轻
两边同样重
问：至少要使用天平多少次才能保证找到假硬币?

答案：是2次，

方法一：可作出如下图的抉择：

所以至少称重2次，才可以确保找出。

方法二：

设X表示硬币，Y表示天平，则，X的取值可以是5枚硬币中的任意一枚，每个硬币的概率都是1/5，那么随机变量X的不确定程度就是:

H(X) = 1/5×log5 + 1/5×log5 + 1/5×log5 + 1/5×log5 +1/5×log5 = log5

Y表示天平，A、B两个硬币放在天平，有三种情况：A < B, A > B, A = B。也就是说Y的表达能力就是log3.因此：

平均编码长度: log5 / log3 = 1.46;换算成次数，也就是至少2次可以确保找到假硬币！

例4、假设有5个硬币：1,2,3,…5，其中一个是假的，比其他的硬币轻。已知第一个硬币是假硬币的概率是三分之一；第二个硬币是假硬币的概率也是三分之一，其他硬币是假硬币的概率都是九分之一。
有一个天平，天平每次能比较两堆硬币，得出的结果可能是以下三种之一：
左边比右边轻
右边比左边轻
两边同样重
假设使用天平n次找到假硬币。问n的期望值至少是多少？

方法一：同样利用Huffman编码的思想，得出下图：