WaterNet论文概要
论文原地址:An Underwater Image Enhancement Benchmark Dataset and Beyond
UIEB数据集
构建了一个水下图像增强基准(UIEB),其中包括950张真实世界的水下图像,其中890张具有相应的参考图像。
水下图像采集有三个目标:
1.应涵盖水下场景的多样性、质量退化的不同特征以及广泛的图像内容;
2.水下图像的数量应该很大;
3.应提供相应的高质量参考图像,以便成对的图像能够进行公平的图像质量评估和端到端学习。
论文提出的原本是图像搜集方法为:这些水下图像是从谷歌,YouTube,相关论文以及我们自己捕获的视频中收集的。
论文中的参考图像为12种图像增强算法产生的结果。然后令多名志愿者进行评判图像增强质量的好坏。这950张图像中有60张图像是没有令评判标准满意的,被称为具有挑战性的图像。
在UIEB数据集重新测试数据增强方法
MSE,PSNR和SSIM三个最常见的图像评估指标上,UIEB数据集明显更青睐于F、D两种方法,同样的是,志愿者们的评价标准与之类似。这说明选取数据集的方法与结果得到了很好的验证。
采用两个非参考指标(即UCIQE和UIQM)对UIEB数据集进行评估,实验结果很有意思,接下来我引用原文内容:
直方图和UDCP 分别获得了UCIQE和UIQM的最高分。潜水+和基于融合的不再是表现最好的。有趣的是,在UCIQE和UIQM指标方面的良好表现与主观成对比较不一致,尽管UCIQE和UIQM都声称他们考虑了人类的视觉感知。
因此,人类的视觉感知可能是对水下图像进行色彩校正的一种完全不准确的方式。
WaterNet网络
主要参考了白平衡、伽马校正与均衡化的图像处理方法(输入原始图片与三种图像增强后的图像)。
WaterNet
MIRNet
钢材目标缺陷检测
主流YOLO算法对比
经过对比,选择yolov5n作为检测的base model。评判的标准依据mAP0.5与mAP、模型大小、计算量与FPS,其他参数作为次要参考标准。
数据输入改进
灰度图像输入
在默认参数下,默认输入图像为(batch_size,3,640,640)的图像,要求输出(batch_size,1,640,640),首先对通道数进行修改。
1 Imread函数修改
2 4-image mosaic函数修改(数据裁剪)
3 opencv通过HWC加载图片,而Pytorch需要CHW,故需要将图片通过 'transpose((2, 0, 1)) ’ 转为CHW。难点在于3通道转为单通道时并不是(1,x,x)而是(x,x)
修改后在参数量与GFLOPs上有了改进