- 项目:http://irvlab.cs.umn.edu/enhancing-underwater-imagery-using-gans
- 论文: https://arxiv.org/pdf/1801.04011.pdf
- 代码:https://github.com/IRVLab/UGAN/find/25a94be6373c7d9bbfd37b81336d584b89a7624b
目录
1.介绍
本文的主要目的是使用生成对抗网络增强水下图像。
在Introduction部分,作者提出当前水下机器人逐渐发展,使用视觉引导的AUV和ROV已广泛使用在许多水下任务之中,但是因为光的折射,吸收和悬浮颗粒的散射会极大地影响光学系统。例如,因为红色波长很快被水吸收,水下图像的色彩趋于绿色或蓝色。随着深度的增加,这种效果会恶化,因为越来越多的红色调被吸收。这种失真本质上是非线性的,并受许多因素(例如存在的光量)的影响,例如:光照角度与强度、海水水质、相机参数等等,因此想要获得清晰的水下图像,使用某一个方法不能改善所有的水下图片,这会影响水下机器人在执行分割,追踪以及分类等直接或间接用到颜色特征的任务的准确性。
2.方法
基于以上所说的问题,作者提出了一种基于深度学习的图像增强算法。方法流程为:首先使用CycleGAN将清晰的水下图像渲染成模糊的水下图像形成水下图像数据对,然后使用所提出的UNDERWATER GAN(即UGAN)做图像增强。
2.1 生成水下数据集
因为场景深度,照明条件,相机型号以及在水下环境中的物理位置都会影响图像失真的因素。 在某些条件下,水下图像可能失真很小,或者根本没有失真。 本文将IC设为没有失真的水下图像,将ID设为没有失真的同一图像。 我们的目标是学习功能f:ID→IC。 由于难以收集水下数据,因此不仅存在ID或IC,由于难以收集水下数据,通常IC和ID都有的情况很少,因此为了为了避免图像对不足的问题,本文使用CycleGAN从IC生成ID,从而提供了成对的图像数据集。(CycleGAN的具体内容请见我的下一篇博客)