Kullback–Leibler 距离(相对熵)

https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence

DKL(P|Q) 用于度量同一概率空间两个概率分布 P , Q 之间的距离,在实际应用中 P 往往代表的是数据真实的分布,而 Q 一般是对 P 的逼近.

μ X 上的任意度量,若Radon-Nikodym 导数存在,即 p=dPdμ , q=dQdμ ,

DKL(P|Q)=Xplogpqdμ

P,Q X 上的概率测度,

DKL(P|Q)=XlogdPdQdP

P,Q 是连续随机变量的概率分布,

DKL(P|Q)=Xlogp(x)q(x)p(x)dx

例如正态分布:
PN(0,1) , QN(1,1)

p(x)=12πexp(x22)

q(x)=12πexp((x1)22)

DKL(P|Q)=Xlogp(x)q(x)p(x)dx=12πXlogexp(x22)exp((x1)22)exp(x22)dx=12πX(12x)exp(x22)dx=1

kl-normal

DKL(P|Q) 的性质:

1.非对称
DKL(P|Q)DKL(Q|P)

2.非负
DKL(P|Q)0 ,当且仅当 P=Q 时等号成立
pf:假设
P,Q 是连续随机变量的概率分布,

DKL(P|Q)=Xlogp(x)q(x)dP

DKL(P|Q)=Xlogq(x)p(x)dPlogXq(x)p(x)dP=0
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值