Stable Diffusion的改进一:图像压缩
Stable Diffusion原来的名字叫“Latent Diffusion Model”(LDM),很明显就是扩散过程发生隐空间中(latent space),其实就是对图片做了压缩,这也是Stable Diffusion比Diffusion速度快的原因。
Stable Diffusion会先训练一个自编码器,来学习将图像压缩成低维表示。
- 通过训练好的编码器 E ,可以将原始大小的图像压缩成低维的latent data(图像压缩)
- 通过训练好的解码器 D ,可以将latent data还原为原始大小的图像
在将图像压缩成latent data后,便可以在latent space中完成扩散过程,对比下和Diffusion扩散过程的区别,如下图所示:
Stable Diffusion的改进二:反向扩散过程