KL散度理解

1. 形式

一般而言,P代表数据x的真实分布,Q代表理论分布。

离散:
K L ( P ∣ ∣ Q ) = ∑ P ( x ) log ⁡ P ( x ) Q ( x ) KL(P||Q) = \sum P(x) \log \frac{P(x)}{Q(x)} \\ KL(PQ)=P(x)logQ(x)P(x)

连续:
K L ( P ∣ ∣ Q ) = ∫ P ( x ) log ⁡ P ( x ) Q ( x ) d x KL(P||Q) = \int P(x) \log \frac{P(x)}{Q(x)} {\bf d} x KL(PQ)=P(x)logQ(x)P(x)dx

2. KL 散度一定大于零

用到 Jensen 不等式
K L ( P ∣ ∣ Q ) = ∑ P ( x ) log ⁡ P ( x ) Q ( x ) = E ( log ⁡ P ( x ) Q ( x ) ) = E ( − log ⁡ Q ( x ) P ( x ) ) KL(P||Q) = \sum P(x) \log \frac{P(x)}{Q(x)} = \mathbb{E} ( \log \frac{P(x)}{Q(x)} ) = \mathbb{E} ( - \log \frac{Q(x)}{P(x)} ) \\ KL(PQ)=P(x)logQ(x)P(x)=E(logQ(x)P(x))=E(logP(x)Q(x))

对数函数是凹函数:
E [ − log ⁡ Q ( x ) P ( x ) ] ≥ − log ⁡ [ ∑ P ( x ) Q ( x ) P ( x ) ] = − log ⁡ [ ∑ Q ( x ) ] = 0 \mathbb{E} \left[ - \log \frac{Q(x)}{P(x)} \right] \geq -\log \left[ \sum P(x) \frac{Q(x)}{P(x)} \right] = - \log \left[ \sum Q(x) \right] = 0 E[logP(x)Q(x)]log[P(x)P(x)Q(x)]=log[Q(x)]=0

因此, K L ( P ∣ ∣ Q ) ≥ 0 KL(P||Q) \geq 0 KL(PQ)0

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值