【算法解析】扩散模型中的Noise Scheduler技术解析

Kaydeon

已于 2024-10-19 22:06:46 修改

阅读量2.3k

点赞数 35

文章标签： pytorch python 人工智能

于 2024-10-06 17:03:10 首次发布

本文链接：https://blog.csdn.net/weixin_42744466/article/details/142729102

版权

在深度学习领域，扩散模型（Diffusion Models）近年来受到了广泛的关注，特别是在图像生成领域。本文将深入探讨扩散模型中的核心组件之一——Noise Scheduler，以及其在生成高质量图像过程中的作用。

Diffusers库中的Schedulers

Diffusion模型的实现依赖于两个核心组件：模型（models）和调度器（schedulers）。Diffusers库提供了丰富的模型和调度器实现，用于构建和训练扩散模型。

扩散模型的通用流程

在训练过程中，扩散模型首先生成一个与输入图像相同尺寸的噪声图像。在每个时间步（timestep），模型会预测噪声残差，然后调度器根据预测出的噪声残差生成一张噪声较少的图像。这个过程会重复进行，直到达到预设的最大时间步，最终生成一张高质量的图像。

Scheduler与PyTorch Scheduler的区别

在扩散模型中，Scheduler是一个采样器，用于将噪声图像还原为原始图像。而在PyTorch中，Scheduler通常指的是学习率调整策略，如余弦退火策略或指数衰减策略。

核心Schedulers原理

1. DDPM (Denoising Diffusion Probabilistic Models)

DDPM是扩散模型的一个经典实现，其模型和调度器对应于论文中的两个算法。

Model学习

模型的学习对应于算法1：

DDPM Model Learning

加噪过程可以表示为：
$x_t = \sqrt{\bar{\alpha}_t} x_0 + \sqrt{1-\bar{\alpha}_t}\epsilon$

其中， $\bar{\alpha}_t$ 是人为设置的超参数序列，随着时间步 $t$ 的增加而减小。 $\alpha_t$ 由 $\beta_t$ 得到， $\alpha_t = 1 - \beta_t$ 。 $\beta_1, \beta_2, \cdots, \beta_T$ 是超参数，随着 $t$ 的增大， $\beta_t$ 逐步变大， $\bar{\alpha}_t$ 逐步变小。