论文解读《Enhancing Underwater Imagery using Generative Adversarial Networks》ICRA2018

最新推荐文章于 2025-02-21 17:52:51 发布

Hz_xi

最新推荐文章于 2025-02-21 17:52:51 发布

阅读量2.3k

点赞数 2

分类专栏：论文文章标签：计算机视觉

本文链接：https://blog.csdn.net/yhz_xi/article/details/107726860

版权

该论文探讨了如何利用生成对抗网络（GAN）改善水下图像质量。通过CycleGAN生成水下图像数据对，并提出UNDERWATER GAN（UGAN）进行图像增强，旨在解决因水下环境因素导致的图像失真问题。实验比较了CycleGAN、UGAN与UGAN-P的效果，以提高水下视觉任务的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目：http://irvlab.cs.umn.edu/enhancing-underwater-imagery-using-gans
论文： https://arxiv.org/pdf/1801.04011.pdf
代码：https://github.com/IRVLab/UGAN/find/25a94be6373c7d9bbfd37b81336d584b89a7624b
目录

1.介绍

本文的主要目的是使用生成对抗网络增强水下图像。

在Introduction部分，作者提出当前水下机器人逐渐发展，使用视觉引导的AUV和ROV已广泛使用在许多水下任务之中，但是因为光的折射，吸收和悬浮颗粒的散射会极大地影响光学系统。例如，因为红色波长很快被水吸收，水下图像的色彩趋于绿色或蓝色。随着深度的增加，这种效果会恶化，因为越来越多的红色调被吸收。这种失真本质上是非线性的，并受许多因素（例如存在的光量）的影响，例如：光照角度与强度、海水水质、相机参数等等，因此想要获得清晰的水下图像，使用某一个方法不能改善所有的水下图片，这会影响水下机器人在执行分割，追踪以及分类等直接或间接用到颜色特征的任务的准确性。

2.方法

基于以上所说的问题，作者提出了一种基于深度学习的图像增强算法。方法流程为：首先使用CycleGAN将清晰的水下图像渲染成模糊的水下图像形成水下图像数据对，然后使用所提出的UNDERWATER GAN（即UGAN）做图像增强。

2.1 生成水下数据集

因为场景深度，照明条件，相机型号以及在水下环境中的物理位置都会影响图像失真的因素。在某些条件下，水下图像可能失真很小，或者根本没有失真。本文将IC设为没有失真的水下图像，将ID设为没有失真的同一图像。我们的目标是学习功能f：ID→IC。由于难以收集水下数据，因此不仅存在ID或IC，由于难以收集水下数据，通常IC和ID都有的情况很少，因此为了为了避免图像对不足的问题，本文使用CycleGAN从IC生成ID，从而提供了成对的图像数据集。（CycleGAN的具体内容请见我的下一篇博客）