Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Dec

最新推荐文章于 2024-10-01 20:17:55 发布

尔呦

最新推荐文章于 2024-10-01 20:17:55 发布

阅读量391

点赞数 1

分类专栏： Super Resolution 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44994838/article/details/138698524

版权

Super Resolution 专栏收录该内容

28 篇文章 3 订阅

订阅专栏

CVPR2024

问题引入

本文introduction部分描述逻辑较为混乱，创新点不是很足，但是整体提炼一下分为两点，其一是改进IDM，使得过程更加efficient，也就是在latent space进行diffusion并且将隐式解码提到diffusion过程之后；其二是同时实现任意尺度超分任务和图像生成任务；
其实本质上只有efficiency这一个创新点，原先IDM就是一个以LR+scale为条件的diffusion model，可以实现任意尺度的超分任务，图像生成就没有LR作为条件；所以整体看起来就是将隐式解码提到diffusion之外可以起效果之后开始讲故事，故事逻辑还混乱；

方法

文章关于LIIF的方法写错了
包含三个部分encoder + denoising diffusion + decoder，本文相当于把LIIF里面encoder换成了三个部分里面的encoder + denoising diffusion，LIIF的MLP换成decoder + MLP，也就是将当成一个大号的特征提取器，之后就是LIIF的MLP过程；
Two-Stage Alignment Process就是在训练的时候加入了重建损失；
消融实验也很简单

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。