- CVPR2024
- 问题引入
- 本文introduction部分描述逻辑较为混乱,创新点不是很足,但是整体提炼一下分为两点,其一是改进IDM,使得过程更加efficient,也就是在latent space进行diffusion并且将隐式解码提到diffusion过程之后;其二是同时实现任意尺度超分任务和图像生成任务;
- 其实本质上只有efficiency这一个创新点,原先IDM就是一个以LR+scale为条件的diffusion model,可以实现任意尺度的超分任务,图像生成就没有LR作为条件;所以整体看起来就是将隐式解码提到diffusion之外可以起效果之后开始讲故事,故事逻辑还混乱;
- 方法
- 文章关于LIIF的方法写错了
- 包含三个部分encoder + denoising diffusion + decoder,本文相当于把LIIF里面encoder换成了三个部分里面的encoder + denoising diffusion,LIIF的MLP换成decoder + MLP,也就是将当成一个大号的特征提取器,之后就是LIIF的MLP过程;
- Two-Stage Alignment Process就是在训练的时候加入了重建损失;
- 消融实验也很简单