改进的IAYOLO---GDIP:Gated Differentiable Image Processing for Object-Detection inAdverse Conditions

沈四岁

已于 2023-01-02 17:31:59 修改

阅读量1.8k

点赞数 2

分类专栏：论文阅读笔记文章标签：深度学习计算机视觉人工智能

于 2023-01-02 17:26:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/swx595182208/article/details/128522651

版权

笔记同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

论文地址：https://arxiv.org/abs/2209.14922

代码地址：https://github.com/Gatedip/GDIP-Yolo

motivation：

（1）现有的目标检测器只能在图像质量很好的情况下才能很好地工作，但是如果想要把目标检测器应用于自动驾驶或者是辅助驾驶，其实更有用的是其能够在实际条件下做检测。

（2）IAYOLO在众多恶劣天气的目标检测器的脱颖而出，但是IAYOLO的过滤器是以一定的顺序对图像进行处理然后进行检测，作者在文中提到这会影响IAYOLO的性能。

创新点：

（1）提出了一种gating mechanism（门控机制），可以使得多个可微图像处理模块concurrent relative weighting（并发相对加权），增强在不同条件下的目标检测。

（2）多尺度的MGDIP。

（3）讲GDIP作为YOLO v3的一个正则化器，直接使YOLO v3针对恶劣天气进行训练，在推理过程中可以删除GDIP。

提出的方法：

（1）GDIP：

和IAYOLO类似，都是采用一些Image Processing（图像处理IP）操作，但是GDIP中的IP并发执行，并且加权组合。

如图所示，每一个Gb的输入都是来自一个Vison Encoder（CNN网络：包含5个卷积层，每个卷积层后是平均池化，最后一层后是全局平均池化，得到的维度是1*1*1024；再经过一个全连接层降维至256）；其中每一个Gb都包含

一个线性层；

一个可微图像处理模块IP，所有IP的输出都会乘以门的标量作为Gb的输出；

一个gate（门：这个gate使用tanh函数返回的是0-1之间的一个值。），

一个归一化操作。

最终对所有的Gb的输出聚合，进而得到想要的增强的图像。公式表达如下：（z是增强后的图像；f 表示IP图像处理操作；表示gate输出的标量；N为归一化操作）

（2）MGDIP:

由于上述的GDIP只使用vision encoder的最后一层，这限制了GDIP可使用参数的范围，所以进一步改进如图：

MGDIP通过将一个GDIP块的输出作为下一个GDIP块的输入逐步增强图像，其中各个GDIP块由vision encoder不同层提取的特征引导。MGDIP的最终增强输出被传递给Yolo进行目标检测。

（3）GDIP作为一个正则器：

如图所示：增强的图像并作为YOLO的输入而是训练正则化得到的副产品。并且这里的GDIP仅仅是为了完善YOLO，让它能够更好的学习的特征，所以它只有在训练的时候才会用到。

将GDIP作为正则化器重新定义的损失函数为：LReg 为重构损失，计算清晰图像和输入图像的L1范数和均方误差损失的组合。

效果：

其中一个消融实验：

在论文有一个gate，前面说它是经过tanh函数输出对应于[0,1]的标量，这里作者论文里做了一个消融实验，来证明gate的必要性。没有了对应于数据集RTTS（有雾）和ExDark（低光照）的mAP分别下降了0.77和0.27。作者在这里给了一张图：在图里可以看到对于低光照，对应的gamma gate的激活值最高；对于有雾的图，DF（除雾）是最高的。增强了GDIP的可解释性。

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
11
评论
改进的IAYOLO---GDIP:Gated Differentiable Image Processing for Object-Detection inAdverse Conditions

GDIP：门控可微图像处理在不利条件下的目标检测，让目标检测在恶劣天气下飞起
复制链接

扫一扫

专栏目录

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。