KL(kullback-Leibler-devergence)散度(相对熵)非负性证明
两个概率分布:P(X)和Q(X),两个分布之间的距离:
根据jensen不等式,为了避免和各种凹凸性混淆,因为外国人眼里的凹凸性和我们常说的有点小差异,不过都是指的同一个东西。凹函数(concave)[类似洞穴,拱桥∩;二阶导<0],凸函数(convex)[二阶导>0]。
log函数为【concave凹函数】;-log函数为【convex凸函数】,则。
则进一步化简:
KL(kullback-Leibler-devergence)散度(相对熵)非负性证明
两个概率分布:P(X)和Q(X),两个分布之间的距离:
根据jensen不等式,为了避免和各种凹凸性混淆,因为外国人眼里的凹凸性和我们常说的有点小差异,不过都是指的同一个东西。凹函数(concave)[类似洞穴,拱桥∩;二阶导<0],凸函数(convex)[二阶导>0]。
log函数为【concave凹函数】;-log函数为【convex凸函数】,则。
则进一步化简: