图像修复前沿（Image Restoration）

Two_Bits

已于 2023-05-06 19:05:23 修改

阅读量1.4k

点赞数 1

分类专栏：计算机视觉深度学习文章标签：计算机视觉人工智能深度学习图像处理

于 2023-04-24 15:21:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Two_Bits/article/details/130343485

版权

深度学习同时被 2 个专栏收录

6 篇文章

订阅专栏

计算机视觉

2 篇文章

订阅专栏

文章探讨了图像修复问题，包括低质量图像到高质量图像的转换，以及深度学习如何通过CNN和Transformer来学习通用先验，从而在该领域取得最新最优（SOTA）效果。当前的网络模型架构如残差块、多尺度和多阶段结构被提及，同时指出图像修复面临的质量和系统复杂性的挑战。文章还列举了一些创新点，如线性复杂度的注意力机制和移除非线性激活函数，以降低模型复杂性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景与现状

图像修复是一个长期存在的低层次视觉问题，旨在从损坏的输入图像中获取高质量图像，例如去模糊、去噪、去雾、去雨以及超分辨等。
$\mathbf{L} = \mathbf{D}(\mathbf{H}) + \gamma$
其中，L是低质量图像，H是高质量图像， $\gamma$ 分别表示成像和传输过程中的退化函数和噪声

图像修复是一个典型的不可逆问题，因为任何原始输入都有很多候选项。为了限定无限的可行解，传统方法通过对不同的修复任务设计不同的先验知识，将图像修复转化为一个MAP问题：
$\mathbf{\hat{H}}= \underset {\mathbf{H}} { \operatorname {arg\,max}} \log P(\mathbf{L}|\mathbf{H}) + \log P(\mathbf{H})$

但是设计这样一个先验，通常具有很大的挑战，而且不可泛化

随着深度学习方法在高层次视觉任务中的使用，以及数据规模的增加，能够隐式的学习通用先验的CNN以及Transformer开始用于解决图像修复任务，并取得了SOTA效果。

目前图像修复的网络模型架构主要包括残差块、多尺度、多阶段、编码器-解码器。

当前面对的问题：图像修复的质量（空间细节、上下文信息）；图像修复的模型系统复杂性

主流方法

残差块结构（2018年 ESRGAN）

在这里插入图片描述

多尺度结构（2020 MIPNet 2022 MIRNetV2）

在这里插入图片描述主要创新点：DAU和SKFF

在这里插入图片描述

在这里插入图片描述

多阶段结构（2021MPRNet）

在这里插入图片描述
主要创新点： SAM

编码器-解码器结构（2022Restormer）

在这里插入图片描述
主要创新点：线性复杂度的注意力机制（就是转置），门控前馈神经网络

编码器-解码器结构（2022Uformer）

在这里插入图片描述
主要创新点 : LeFF和modulator （对这个模块的作用存疑，提升的太大了）

编码器-解码器结构（2022 NAFNet）

在这里插入图片描述

主要创新点：移除或替代了非线性激活函数，使模型系统复杂性降低。主要是提出了一个新的baseline，后续可以在其基础上进行做一些工作。

总结

感觉图像修复真的太吃设备了，动不动就跑几周，时间成本太大了

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。