KL散度(Kullback-Leibler divergence)

  • K L KL KL散度( K u l l b a c k − L e i b l e r   d i v e r g e n c e Kullback-Leibler\ divergence KullbackLeibler divergence),也被称为相对熵、互熵或鉴别信息,是用来衡量两个概率分布之间的差异性的度量方法。以下是对 K L KL KL散度的详细解释:

定义

  • K L KL KL散度用于量化使用一个概率分布来近似另一个概率分布时损失的信息量。设P(x)和Q(x)是随机变量X上的两个概率分布,KL散度的定义如下:

  • 在离散随机变量的情形下:
    K L ( P ∣ ∣ Q ) = ∑ x P ( x ) log ⁡ Q ( x ) P ( x ) KL(P||Q) = \sum_{x} P(x) \log \frac{Q(x)}{P(x)} KL(P∣∣Q)=xP(x)logP(x)Q(x)

  • 在连续随机变量的情形下:
    K L ( P ∣ Q ) = ∫ P ( x ) log ⁡ Q ( x ) P ( x ) d x KL(P|Q) = \int P(x) \log \frac{Q(x)}{P(x)} dx KL(PQ)=P(x)logP(x)Q(x)dx
    性质

  • 非负性: K L KL KL散度始终大于等于零,即 D ( P ∥ Q ) ≥ 0 D(P∥Q)≥0 D(PQ)0。当且仅当 P P P Q Q Q相等时, K L KL KL散度为零。

  • 不对称性: K L KL KL散度是非对称的,即 D ( P ∥ Q ) ≠ D ( Q ∥ P ) D(P∥Q)\neq D(Q∥P) D(PQ)=D(QP)。这是因为 K L KL KL散度是基于信息论的概念,而信息的传递方向是有区别的。

  • 不满足三角不等式: K K KL散度不满足三角不等式,即 D ( P ∥ R ) > D ( P ∥ Q ) + D ( Q ∥ R ) D(P∥R)>D(P∥Q)+D(Q∥R) D(PR)>D(PQ)+D(QR)。这是因为 K L KL KL散度不是真正的距离度量,而是一种相对信息的度量。

  • 与凸函数的关系:如果 f ( x ) f(x) f(x)是一个凸函数,那么 K L KL KL散度 D ( P ∥ Q ) D(P∥Q) D(PQ)是关于概率分布 P P P的凸函数。 应用

应用

  • 机器学习:在变分自编码器( V A E VAE VAE)、 E M EM EM算法、 G A N GAN GAN网络中都有使用 K L KL KL散度作为优化目标或衡量标准。
  • 模型拟合:通过计算模型预测分布与真实分布之间的 K L KL KL散度,可以找到最优的模型参数。
  • 图像处理:在图像分割、图像去噪等任务中, K L KL KL散度可以作为衡量不同区域或不同图像之间相似性的指标。
  • 信息检索:在信息检索系统中, K L KL KL散度可以用来衡量用户查询与搜索结果之间的相关性。

示例

  • 以标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1)和一般正态分布 N ( μ , σ 2 ) N(μ,σ 2 ) N(μ,σ2)之间的 K L KL KL散度为例,计算结果为:

K L ( ( μ , σ 2 ) ∥ N ( 0 , 1 ) ) = 1 2 [ log ⁡ ( σ 2 ) + μ 2 + σ 2 − 1 ] KL((\mu, \sigma2) \parallel N(0, 1)) = \frac{1}{2} \left[ \log(\sigma2) + \mu2 + \sigma2 - 1 \right] KL((μ,σ2)N(0,1))=21[log(σ2)+μ2+σ21]

  • 这个公式可以帮助我们理解当使用一个正态分布来近似另一个正态分布时,损失了多少信息。
  • 12
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值