关于相对熵的推导证明和推论

相对熵可以衡量两个分布之间的不相似性,即 P 和 Q 两个分布越相似,相对熵越小,否则越大。

相对熵的公式是

D K L ( P ∣ ∣ Q ) = ∑ i p i log ⁡ p i q i D_{KL}(\mathrm{P} || \mathrm{Q}) = \sum_{i} p_i \log{\frac{p_i}{q_i}} DKL(PQ)=ipilogqipi

显然,当 P 和 Q 的分布完全相同时,log 里就是 1,所以每项都是 0,相对熵也为 0,印证了开头的那句话。

关于相对熵有个不等式:

D K L ( P ∣ ∣ Q ) ≥ 0 D_{KL}(\mathrm{P} || \mathrm{Q}) \geq 0 DKL(PQ)0

下面给出两种证明方法:

  1. 由于在 x ∈ ( 0 , 1 ] x \in (0, 1] x(0,1] 时,有 ln ⁡ ( x ) ≤ x − 1 \ln(x) \leq x-1 ln(x)x1 当且仅当 x = 1 x=1 x=1 时等号成立,因此有
    − D K L ( P ∣ ∣ Q ) = ∑ i p i log ⁡ q i p i ≤ ∑ i p i ( q i p i − 1 ) = ∑ i ( q i − p i ) = ∑ i q i − ∑ i p i = 0 -D_{KL}(\mathrm{P}||\mathrm{Q}) = \sum_i p_i \log{\frac{q_i}{p_i}} \leq \sum_i p_i (\frac{q_i}{p_i} - 1) = \sum_i (q_i - p_i) = \sum_i q_i - \sum_i p_i = 0 DKL(PQ)=ipilogpiqiipi(piqi1)=i(qipi)=iqiipi=0
    所以有 D K L ( P ∣ ∣ Q ) ≥ 0 D_{KL}(P || Q) \geq 0 DKL(PQ)0

  2. 根据 Jensen 不等式,由于 log ⁡ ( x ) \log(x) log(x) 是一个严格的 concave 函数,所以有
    − D K L ( P ∣ ∣ Q ) = ∑ i p i log ⁡ q i p i ≤ log ⁡ ∑ i p i q i p i = log ⁡ ∑ i q i = 0 -D_{KL}(\mathrm{P}||\mathrm{Q}) = \sum_i p_i \log{\frac{q_i}{p_i}} \leq \log \sum_i p_i \frac{q_i}{p_i} = \log \sum_i q_i = 0 DKL(PQ)=ipilogpiqilogipipiqi=logiqi=0
    所以有 D K L ( P ∣ ∣ Q ) ≥ 0 D_{KL}(P || Q) \geq 0 DKL(PQ)0

如果我们把相对熵公式展开,会得到

D K L ( P ∣ ∣ Q ) = ∑ i p i log ⁡ p i − ∑ i p i log ⁡ q i = H ( P , Q ) − H ( P ) ≥ 0 D_{KL}(\mathrm{P} || \mathrm{Q}) = \sum_i p_i \log{p_i} - \sum_i p_i \log{q_i} = \mathbf{H} (\mathrm{P}, \mathrm{Q}) - \mathbf{H} (\mathrm{P}) \geq 0 DKL(PQ)=ipilogpiipilogqi=H(P,Q)H(P)0

我们就得到了 Gibbis 不等式:

− ∑ i p i log ⁡ q i ≥ − ∑ i p i log ⁡ p i -\sum_i p_i \log{q_i} \geq -\sum_i p_i \log{p_i} ipilogqiipilogpi

图片来自维基百科

即因为相对熵 = 交叉熵 - 熵且其大于等于 0,故有交叉熵 ≥ 熵

相对熵又叫 KL 散度,或信息增益,也称信息散度。

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值