读论文：DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior

木水_

已于 2024-02-04 16:59:17 修改

阅读量2.1k

点赞数 25

分类专栏：深度学习文献阅读文章标签：人工智能 DiffBIR Diffusion ControlNet

于 2024-02-04 15:48:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37324740/article/details/136026105

版权

DiffBIR是2023年ICCV上的一种盲图像恢复模型，通过预训练的SwinIR结构和生成先验的两阶段处理，解决模糊、噪声等退化问题。它强调保真度与真实感的平衡，利用LAControlNet控制保真度，避免颜色偏移。文章详细描述了数据退化过程和模型的保真度真实性权衡策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DiffBIR 发表于2023年的ICCV，是一种基于生成扩散先验的盲图像恢复模型。它通过两个阶段的处理来去除图像的退化，并细化图像的细节。DiffBIR 的优势在于提供高质量的图像恢复结果，并且具有灵活的参数设置，可以在保真度和质量之间进行权衡。网络结构图如下所示：

优化的痛点问题：
平衡扩散模型内在具有的真实感先验以及图像复原任务所需要的保真度要求。

two stage 的网络总体架构
stage one：去除退化的预训练模型
SwinIR 的结构（8个残差Swin Transformer block，每个RSTB包含6个Swin Transformer Layers (STL)）；
处理多种任务：模糊，噪声，压缩伪影和低分辨率（二阶退化采用经典退化模型：模糊-调整大小-噪声过程两次）
3 × 3卷积层进行浅层特征提取；深度特征提取采用多个残差Transformer块（低分辨率空间）。
stage two：利用生成先验进行图像重建
Stable Diffusion 的方法（Stable Diffusion 2.1-base 3，并进行微调）；

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。