本文内容核心内容非原创,大部分摘抄自该视频教程,详细讲解请移步原视频。个人在此基础上添加补充了一些公式的推导和证明,仅供学习参考,如有任何疑问欢迎在评论区指出。
一. 条件概率公式和高斯分布的KL散度
1. 条件概率的一般形式
2. 基于马尔可夫假设的条件概率
如果A、B、C满足马尔可夫关系,那么有
3. 高斯分布的KL散度公式
对于两个(连续型)随机变量,它们的KL散度定义为:
若,则有结论:
证明:
由于是均值为,方差为的高斯分布的密度函数,其有如下性质:
(1)
(2)
(3)
(4)
于是KL散度公式可化简为:
4. 参数重整化
我们希望学习一个高斯分布的均值和方差,但由于采样过程对于和不可导,不能直接从高斯分布