1、KL-divergence,衡量的是相同事件空间里的两个概率分布的差异情况。其物理意义是:在相同事件空间里,概率分布P(x)的事件空间,若用概率分布Q(x)编码时,平均每个基本事件(符号)编码长度增加了多少比特。
- Kullback-Leibler divergence (information divergence, information gain, relative entropy)
- KL距离、信息散度、信息增益、相对熵、交叉熵
- 表示两个概率分布之间的差异程度
- 性质
- 虽然是“距离”,不满足距离定义的三个条件:1)非负性;2)对称性(不满足);3)三角不等式(不满足)。
对于离散随机变量,其概率分布P和Q的KL散度可按下式计算
对于连续随机变量,其概率分布P和Q可按积分方式定义为