Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Dec

  • CVPR2024
  1. 问题引入
  • 本文introduction部分描述逻辑较为混乱,创新点不是很足,但是整体提炼一下分为两点,其一是改进IDM,使得过程更加efficient,也就是在latent space进行diffusion并且将隐式解码提到diffusion过程之后;其二是同时实现任意尺度超分任务和图像生成任务;
  • 其实本质上只有efficiency这一个创新点,原先IDM就是一个以LR+scale为条件的diffusion model,可以实现任意尺度的超分任务,图像生成就没有LR作为条件;所以整体看起来就是将隐式解码提到diffusion之外可以起效果之后开始讲故事,故事逻辑还混乱;
  1. 方法
  • 文章关于LIIF的方法写错了
    在这里插入图片描述
  • 包含三个部分encoder + denoising diffusion + decoder,本文相当于把LIIF里面encoder换成了三个部分里面的encoder + denoising diffusion,LIIF的MLP换成decoder + MLP,也就是将当成一个大号的特征提取器,之后就是LIIF的MLP过程;
  • Two-Stage Alignment Process就是在训练的时候加入了重建损失;
  • 消融实验也很简单
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值