在前向过程(diffusion过程),例如此时取batch-size为4,然后每一个图像取随机的扩散次数T,得到了4个不同程度的noise image,然后将这些noise image输入进UNet就得到了噪声 ,现在求真实噪声Z和的损失,可以使用 L1 loss / L2 loss
但是这种每一个Xt输入进UNet,然后得到噪声 并不是很好的一个过程,因为这种由 去除 得到的图像一般比较模糊,我们希望的是由 得到 ,...这样一步步的得到最后的图像 ,这样得到的去噪图像会更清晰
我们如何求出这个函数 f 呢(也就是上述红色箭头表示的)?如果求出这个 f ,那么逆向过程就很清晰了