《A Comprehensive Survey on Image Dehazing Based on Deep Learning》
1.Introduction
- 基于深度学习的去雾方法主要分为无监督去雾和有监督去雾。其中监督方法需要成对的模糊图像和无模糊图像;无监督的方法通常以未配对的图像作为训练集
- 深度学习的去雾有三个重要因素:
- 大气散射模型(ASM)
- Transmission map (Trans)
- 额外的数据(Extra data)
1.1Goals of our survey
- 总结常用的数据集和损失函数
- 为基于深度学习的SOTA去雾算法提供了一种分类方法并介绍了各个方法的核心技术
- 指出将给未来关于去雾任务带来灵感的未决问题
该综述提供了对用于白天的、基于深度学习的有监督和无监督去雾模型的综合调查。
1.2数据集
- D-Hazy、HazeRD、RESIDE:基于包含深度注释的数据集而合成的
- I-HAZE、O-HAZE、NH-HAZE:由一个专业的雾霾发生器制作出来的
- MRFID、BeDDE:最近提出、包含在真实世界中收集到的有雾和无雾的图像;但是数据不足所以不适合采用大容量去雾模型
1.3评价指标
- 峰值信噪比(PSNR)
- 结构相似度指数(SSIM)
- CIEDE2000:评价去雾图像和参考的无雾图像之间的色差
1.4损失函数
-
常用的损失函数:
- L1/L2
- SSIM
-
感知损失(perceptual loss)
2.有监督去雾方法研究现状
2.1.ASM模型与卷积神经网络相结合
估计两个参数:transmission maps t ( x ) t(x) t(x) and atmospheric light value A
根据不同类型的输入数据,我们将基于ASM的有监督模型分为单目去雾和双目去雾
-
单目去雾(3种类型)
-
用深度神经网络来估计 t ( x ) t(x) t(x)并使用先验假设来估计A
- DehazeNet(非端到端):用L2损失来估计 t ( x ) t(x) t(x) ,最暗的0.1%个像素估计A
- Single image dehazing via multi-scale convolutional neural networks with holistic edges(可训练端到端):通过具有整体边缘的多尺度卷积神经网络
-
多个神经网络来联合估计 t ( x ) t(x) t(x)和A
-
DCPDN:联合学习 t ( x ) t(x) t(x)和A,是一个端到端物理去雾模型,将ASM完全嵌入到整体优化框架中
联合鉴别器的优化过程:
-
-
重新制定ASM,以避免对 t ( x ) t(x) t(x)和A的估计所造成的累积误差
-
AOD-Net
实验证明,在不单独估计 t ( x ) t(x) t(x)和 A A A的情况下仍然可以获得可靠的去雾性能
-
FAMEDNet同样采用了该思想
由于收集 t ( x ) t(x) t(x)是耗时的工作,重新制定ASM有效简化去雾过程
-
-
-
双目去雾(增强了去雾模型对数据集的依赖性)
通常使用左右视图作为联合输入
- Deep network for simultaneous stereo matching and dehazing:一种多任务网络SSMD-Net,可以通过立体有雾图像对来联合估计清晰的图像和视差,但是它只能估计左边的无雾图像
- BidNet:可以产生双目去雾图像对(估计立体t时,BidNet设计了STM来转换深度信息)
- Simultaneous deep stereo matching and dehazing with feature attention:注意力机制与双目任务相结合,自监督蒸馏法将模型应用于真实世界的图像。
2.2直接学习从有雾图像到无雾图像的映射
(需要成对的有雾和无雾图像)
-
注意力机制【Ffanet: Feature fusion attention network for single image dehazing】
-
知识蒸馏【Distilling image dehazing with heterogeneous task imitation】
-
域自适应【Domain adaptation for image dehazing】
-
多输入融合
- GFN:融合三个输入(白平衡 I w b I_{wb} Iwb、对比度增强 I c e I_{ce} Ice、伽马矫正 I g c I_{gc} Igc)
-
注意力机制
FFA-Net:在使用CNN进行特征提取时,不应平等地对待通道级和像素级特征
-
全局平均池化 H p H_p Hp来获取全局空间信息
-
通道注意力
-
像素注意力
-
GAN高质量图像生成(不稳定)
-
-
知识蒸馏
KDDN:将教师网络设置为图像重建任务,并使学生网络模拟这一过程
- 结合了三个损失函数来训练S-Network
- T-Network迁移到S-Network进行去雾的过程
-
域自适应
DAID:通过联合训练一个图像转变模块和两个图像去雾模块来实现的域自适应方法
- 充分利用合成数据进行去雾任务
3.无监督去雾方法研究现状
无监督去雾方法更适合于现实世界的去雾任务,可以有效地降低数据采集成本
-
Cycle-Dehaze network:提出了学习有雾域和无雾域之间的双向映射函数
- 生成器G负责学习从有雾图像到无雾图像的映射,生成器F的训练目的是获得相反方向的映射
- 损失函数:循环感知一致性损失(Cycle-Dehaze)和Cycle-GAN的损失组成
-
DHL-Dehaze:(同一模型在不同雾霾密度下的去雾结果)
- 多域图像到图像转换的角度处理了多个雾霾级域
- 得到目标域图像的分类和对抗性损失
- 通过源域与目标域之间的对抗性训练过程,有雾图像可以在不改变场景内容的情况下实现雾霾级别的转变
-
Deep-DCP(设计损失函数):提出仅使用有雾图像作为输入来更新模型的参数,其训练过程是最小化暗通道先验(DCP)能量函数
-
能量函数:
由Deep-DCP设计的DCP loss可以很容易地与不同的CNN架构合作。对无监督损失的探索是一个有价值的研究方向。
-
-
zero-shot image dehazing:试图尽量减少对图像数量的依赖性
- 具有无监督的零样本的特点:只需要学习和推断一个有雾的图像
- 包含三个子网络: f J ( . ) ( J − N E T ) 、 f T ( . ) ( T − N E T ) 、 f A ( . ) ( A − N E T ) f_J(.)(J-NET)、f_T(.)(T-NET)、f_A(.)(A-NET) fJ(.)(J−NET)、fT(.)(T−NET)、fA(.)(A−NET)分别用于估计去雾图像、t和A
- 局限性是对单个有雾图像的推断速度相对较慢,因为它需要对每个输入进行单独的训练。
4.Challenges and Opportunities
- ASM问题:ASM只是雾霾形成过程的一个近似值,有固定的局限性
- 在真实域和合成域之间的转换
- 合成数据如何有效的迁移到真实世界
- 需要大量可靠的数据集和配对的真实数据集
- 计算效率和新的指标:必须在参数的数量、推理时间和定量性能之间找到一个平衡
- 外部数据和预训练过的模型
- 有监督和无监督的去雾方法都可以在感知损失的帮助下提高去雾图像的质量。
- 对于外部数据和预训练过的模型如何提高模型的性能
- 去雾霾算法可以处理的雾霾密度:密度越高,去雾模型得到的去雾图像质量越低