Abstract
解决的问题:恶劣环境下的目标检测
贡献:
- 提出了一个极其轻量级的增强模型(45k个参数),称为DENet。为了有效和高效地增强,在DENet中应用了基于Laplacian-pyramid的结构。GEM为增强LF分量设计和开发了DEM(细节增强模块)自适应增强细化HF分量
- 通过级联DENet和yolov3,获得了一种称为DE-YOLO的端到端检测框架,只使用正常的检测损失,不需要高质量的GT图像
- 与不同类型的SOTA方法相比,所提出的方法提供最可靠的检测结果,同时所需的运行时间非常有限
实验表明DENet避免了繁重的计算,忠实地保留了有利于检测的潜在特征,并且DE-YOLO对在正常条件和恶劣天气条件下拍摄的图像都是有效的
Introduction
存在的问题:
- 现有的物体检测器都是高图像质量上训练,但是在实际应用中如自动驾驶,图片在极端天气情况下,如低光、有雾,由于训练图片和测试图片存在大范围的偏移,这些目标检测模型在极端天气环境下也许不能提供可靠的结果。
- 为了提升在恶劣天气环境下检测性能,通常会在检测前使用先进的图像增强技术,但是为了建立从低质量图像到高质量图像复杂的非线性映射,许多增强模块会有很大的模型尺寸,太大的模型尺寸对实时检测是不利的。即使现在有一些很小的模型运行时间很短,但是对于人类视觉他们的提升十分有限
- 许多增强模型都是通过使用增强损失来训练的,增强损失测量增强图像与真实情况之间的距离,一方面,无法在实际应用中获clean GT image,另一方面这种损失函数平等对待每一个像素,无法更多地关注有利于目标检测的特征
本文解决方案:
1、使用Laplacian pyramid将输入图像分解为低频和高频分量。通常,天气特定信息(对比度,光源)更多地与LF分量有关,因此,为了减轻恶劣天气对探测的影响,很好地捕捉和微调在LF分量中的多尺度信息是很重要的。
2、为LF分量设计了一个GEM(global enchancement module)由4个平行的不同尺寸卷积组成,由于天气特定信息与物体相互作用的原因,我们从LF分量中提取跨层制导信息,然后应用仿射变换将引导信息合并到每个HF分量的特征中,从而可以很好地描绘HF信息,例如边缘和纹理。
3、为了避免正常增强损失函数的缺点,我们假设clean GT不可用
Method
Laplacian-pyramid-based Enchancement
通过使用Laplacian pyramid decomposition 可以将输入图像I分解为LF分量和HF分量。
LF,HF在第i层分解层的计算如下:
-
N是分解的层数
-
B()代表通过2D高斯卷积核(尺寸5*5)模糊输入
-
代表上采样
-
代表下采样
很明显分解是完全可逆的
L经过N-1次高斯模糊,有着最低的分辨率,L是LF分量,它可能包含全局照明和大规模结构
Hi由HF残余细节组成,并具有更大的分辨率,从高分解级别到低分解级别,图像细节的粗滤级别到精细级别分别存储在Hi中
由于LF分量显示全局照明,在DENet中设计了GEM提高对比度并恢复LF分量中的可见性,LF分量低分辨率导致GEM中的计算负担较低,因此使用Laplacian pyramid分解和构建GEM对于LF分量是有利于DE-YOLO的检测速度。
注意到Laplacian pyramid中的HF分量包含从粗到细的局部细节,并且这些细节与LF分量高度相关。因此,在每个HF层部署了一个DEM通过合并从跨水平制导模块提取的制导来高效的增强局部细节
GEM
我们的DENet目标不是获得接近于人眼的clean GT.因此不需要建立从低质量图像到GT的复杂映射。这使得GEM足够简单。
前两个卷积用来从LF分量提取特征,由于GEM是为了增强图像中的全局结构和对比度/照明度构建的,因此使用不同大小的内核来很好地捕捉多尺度信息是合理的,接着使用了4个平行的卷积。因为LF分量的分辨率很小,7*7的卷积核足够覆盖原图的很大一篇区域。因此,可以很好地描述特定于环境的知识,例如照明条件或在整个图像上扩散的雾,为了进一步降低计算复杂度和参数量,每个平行输出的特征图被压缩到8个通道。
DEM
为了增强HF分量,DEM和CGM被建立。CGM用来从LF分量提取指导信息,为了嵌入未处理分量L和增强分量L’之间的差异,L和L‘都被送到CGM,因为LF分量在空间上关联HF分量,一个空间注意力机制被用来定位LF和HF高度相关的位置。最后,一个3*3卷积被用来进一步细化32个特征图
DEM在CGM提供的指导信息,被用来增强HF分量
由于LF和每个HF分辨率不同,在进入DEM之前,使用双线性插值对跨层指导信息进行上采样。注意HF的分辨率随着分解水平的降低而变大。因此,为每个HF分量构建复杂的增强模块可能会引起大量计算,从而显著降低检测速度。为了有效地增强HF分量,使用简单的残差块,并应用仿射变换将引导信息合并到提取的HF特征中。
仿射变换
Fi代表提取HF特征,代表元素级的乘法,αi和βi是缩放和第i层分解层的偏移参数,它们通过将上采样的指导信息G馈送到两个不同的3*3卷积层来学习的。