读论文:DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior

DiffBIR是2023年ICCV上的一种盲图像恢复模型,通过预训练的SwinIR结构和生成先验的两阶段处理,解决模糊、噪声等退化问题。它强调保真度与真实感的平衡,利用LAControlNet控制保真度,避免颜色偏移。文章详细描述了数据退化过程和模型的保真度真实性权衡策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

         DiffBIR 发表于2023年的ICCV,是一种基于生成扩散先验的盲图像恢复模型。它通过两个阶段的处理来去除图像的退化,并细化图像的细节。DiffBIR 的优势在于提供高质量的图像恢复结果,并且具有灵活的参数设置,可以在保真度和质量之间进行权衡。网络结构图如下所示:

  • 优化的痛点问题:
  • 平衡扩散模型内在具有的真实感先验以及图像复原任务所需要的保真度要求。

  • two stage 的网络总体架构
  • stage one:去除退化的预训练模型
  • SwinIR 的结构(8个残差Swin Transformer block,每个RSTB包含6个Swin Transformer Layers (STL));
  • 处理多种任务:模糊,噪声,压缩伪影和低分辨率(二阶退化采用经典退化模型:模糊-调整大小-噪声过程两次)
  • 3 × 3卷积层进行浅层特征提取;深度特征提取采用多个残差Transformer块(低分辨率空间)。
  • stage two:利用生成先验进行图像重建
  • Stable Diffusion 的方法(Stable Diffusion 2.1-base 3,并进行微调);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值