【人工智能与深度学习】KL散度公式

KL散度(Kullback-Leibler divergence),也称为相对熵,是用于测量两个概率分布 ( P ) 和 ( Q ) 差异的度量。假设 ( P ) 和 ( Q ) 是离散概率分布,KL散度定义为:

[
D_{\text{KL}}(P \parallel Q) = \sum_{x \in X} P(x) \log\left(\frac{P(x)}{Q(x)}\right)
]

其中 ( X ) 是所有可能事件的集合,( P(x) ) 和 ( Q(x) ) 分别是事件 ( x ) 在两个分布中的概率。

对于连续概率分布,KL散度的公式变为:

在这里插入图片描述

这里 ( p(x) ) 和 ( q(x) ) 是连续分布的概率密度函数。

KL散度是非对称的,即DKL (P∥Q)不一定等于DKL(Q∥P)。这意味着它衡量了从 ( P ) 到 ( Q ) 的“距离”或差异,并非双向的距离。
让我们用一种轻松有趣的方式来探讨KL散度的推导过程。首先,我们需要理解KL散度的基本概念和它的重要性。KL散度,或者说Kullback-Leibler散度,是一种度量两个概率分布差异的方法。它告诉我们,如果我们基于一个分布(比如Q)来解释或模拟另一个分布(比如P),会有多少“信息损失”。

离散概率分布的情况
假设我们有两个离散概率分布P和Q。我们如何比较它们?一个直观的方法是看看对于每个事件,这两个分布分配了多少概率,并计算它们的差异。但是,KL散度并不是简单地计算这些概率差的总和,而是使用一个更复杂的方法来量化这种差异。

Step 1: 概率的对数
首先,考虑对数函数。对数是一个非常有用的工具,因为它可以将乘法转换为加法,这在概率论中特别有用。对于KL散度,我们对每个事件的概率比 px/qx取对数。

Step 2: 加权和
接下来,我们不只是简单地将这些对数值相加。相反,我们以P分布中的概率作为权重,对所有可能事件的这些对数值进行加权求和。这样做的原因是我们更关注P分布中较可能发生的事件。

公式
把这些组合起来,我们得到KL散度的公式:
在这里插入图片描述
连续概率分布的情况
对于连续分布,整个过程类似,只是我们用积分代替求和,因为我们现在处理的是概率密度函数,而不是概率质量函数。

直观理解
可以把KL散度想象成一种“惊讶度”的度量。如果你根据分布Q预测事件,而真实分布是P,KL散度就告诉你,平均而言,你的预测有多么“出乎意料”。

其中,概率的对数为什么使用概率比呢?
使用概率比 Q(x) / P(x)

来计算KL散度的原因是为了更好地理解和度量两个概率分布 P 和 Q 之间的差异。下面是几个关键点来解释为什么要使用概率比:

相对差异而非绝对差异:当我们仅仅比较概率差
P(x)−Q(x) 时,我们得到的是绝对差异。但绝对差异不总是提供足够的信息,尤其是在概率很小的情况下。相比之下,概率比
Q(x) / P(x)
描述了相对差异,能更好地表达事件在一个分布中的重要性相对于另一个分布的变化。

信息论的角度:从信息论的角度来看,概率比与信息增益和惊讶度(surprisal)密切相关。一个事件的惊讶度由其发生概率的对数决定。当我们考虑两个分布时,概率比的对数(即 log(Q(x) / P(x) )提供了一个衡量从Q到P的视角下信息增益或惊讶度变化的方法。

跨分布比较的一致性:通过使用概率比,我们可以在不同的上下文中一致地比较概率分布。这种方法不依赖于特定分布的绝对概率值,而是关注它们之间的相对关系。

数学和统计属性:概率比在数学和统计学中有许多有用的属性。例如,它在比较概率分布时提供了一种数学上优雅和统一的框架,可以用于各种统计推断和信息理论分析。

直观理解:最后,使用概率比可以提供一种直观的方式来理解一个事件在一个分布中的重要性相对于另一个分布的变化。这种方法能够直观地反映出两个概率分布之间的差异。

综上所述,概率比在计算KL散度时被使用,主要是因为它提供了一种有效、一致且直观的方式来度量和比较两个概率分布之间的差异。

  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值