(图:from DALLE)
一、公式
KL散度是深度学习中,求groundTruth和推理结果概率分布的一个重要数学工具。先给出推导
KL散度分为离散和连续两种形式:
二、推导
由于我们只用到离散表达的公式,所以这里的证明也是离散的,但是连续KL散度同理。
1、假设我们有两个分布P和Q,现对分布P进行N次实验,得到最终某一个结果的概率就是 ,是发生的具体事件(有M类),总共进行了次。
2、如果Q也发生了同样的所有事件,那么得到的结果最终概率为。
3、将这两个最终概率相除,取对数。
4、P和Q分布都有M种结果,则P和Q的所有种类事件的次数均为:,
。
5、当N足够大时,
。
还有一种信息熵推导KL散度的公式,有机会补上