ML16信息论

最新推荐文章于 2025-04-03 15:56:11 发布

dianlei

最新推荐文章于 2025-04-03 15:56:11 发布

阅读量196

点赞数

分类专栏：机器学习文章标签：机器学习

17 篇文章

订阅专栏

《深度学习》 3.13 信息论

信息论的基本想法是：一件不太可能的事发生，要比一件非常可能的事发生，提供更多的信息。
该想法可描述为以下性质：
1. 非常可能发生的事件信息量要比较少，并且极端情况下，一定能够发生的事件应该没有信息量。
2. 比较不可能发生的事件具有更大的信息量。
3. 独立事件应具有增量的信息。例如，投掷的硬币两次正面朝上传递的信息量，应该是投掷一次硬币正面朝上的信息量的两倍。

自信息（self-information）是一种量化以上性质的函数，定义一个事件x的自信息为：

$I(x)=-\log P(x)$

当该对数的底数为自然对数 e 时，单位为奈特（nats）；当以 2 为底数时，单位为比特（bit）或香农（shannons）
自信息只处理单个的输出。
信息熵（Information-entropy）用于对整个概率分布中的不确定性总量进行量化：

$H(\mathrm{X})=\mathbb{E}_{\mathrm{X} \sim P}[I(x)]=-\sum_{x \in \mathrm{X}}P(x)\log P(x)$

信息论中，记 0log0 = 0

定义 P 对 Q 的 KL 散度（Kullback-Leibler divergence）：

$D_P(Q)=\mathbb{E}_{\mathrm{X}\sim P}\left [ \log \frac{P(x)}{Q(x)} \right ]=\sum_{x \in \mathrm{X}}P(x)\left [ \log P(x)-\log Q(x) \right ]$