相对熵
上次我们讲到IV和PSI的公式可以用一个通用表达式表示:
并且用熵的概念简要的说明了为什么对数项可以表明信息量的大小。 对于通用公式的后半部分,没有展开来讲,今天我们这里入手,其实:
对后一项进行变换
从这部分入手,有一种更好的解释,熟悉熵家族的同学可能已经看出来了,每一项其实都是相对熵(也被称为KL散度),PSI其实是
和
分布互相的相对熵之和。
非对称度量指标:KL散度
KL散度又称相对熵、信息散度。KL散度主要是用来衡量两个概率分布之间的差异。
假设
和
是关于
的两个概率分布,则
对
的KL散度为
KL散度具有以下性质KL散度具有非对称性,KL散度尽管被用来度量两个分布的相似度或者说距离ÿ