Denoising Diffusion Probabilistic Models (DDPM) 中提到当变分下界中导出的两个分布 都为高斯分布时,
假设方差相同,要求他两的KL散度,其实
所以最后要最小化变分下界的时候
中间连加号KL散度的优化就可以变为
Denoising Diffusion Probabilistic Models (DDPM) 中提到当变分下界中导出的两个分布 都为高斯分布时,
假设方差相同,要求他两的KL散度,其实
所以最后要最小化变分下界的时候
中间连加号KL散度的优化就可以变为