CycleISP: Real Image Restoration via Improved Data Synthesis通过改进数据合成实现真实图像恢复

Joney Feng

已于 2025-05-14 15:35:17 修改

阅读量755

点赞数 22

文章标签：人工智能增强现实数码相机

于 2025-05-14 15:29:24 首次发布

本文链接：https://blog.csdn.net/ADICDFHL/article/details/147954522

版权

摘要

大规模数据集的可用性极大释放了深度卷积神经网络（CNN）的潜力。然而，针对单图像去噪问题，获取真实数据集成本高昂且流程繁琐。因此，图像去噪算法主要基于合成数据开发与评估，这些数据通常通过广泛假设的加性高斯白噪声（AWGN）生成。尽管CNN在合成数据集上表现优异，但在真实相机图像中效果不佳，如近期基准数据集所示。这主要因为AWGN不足以建模真实相机噪声——其具有信号依赖性且受相机成像流程（ISP）深度变换。本文提出一种框架，对相机成像流程进行正反向建模，使其能在RAW和sRGB空间生成任意数量的真实图像对用于去噪。通过在真实合成数据上训练新去噪网络，我们在真实相机基准数据集上实现了最先进性能。模型的参数量比此前RAW去噪最优方法减少约5倍。此外，我们证明该框架可泛化至图像去噪之外的任务（如立体电影色彩匹配）。源代码与预训练模型已开源：https://github.com/swz30/CycleISP

一、引言

计算机视觉任务的发展
以图像分类、目标检测和分割为代表的高层视觉任务受益于深度卷积神经网络(CNNs)。大规模数据集(如ImageNet)的可用性是关键推动力。技术瓶颈：低层视觉任务(去噪、超分、去模糊等)的数据采集成本极高，需在同一场景拍摄多张噪声图像进行像素级对齐和平均生成干净图像，易受光照变化和运动模糊干扰。
合成数据局限性
现有方法通过在sRGB图像中添加AWGN(加性高斯白噪声)生成训练数据，但真实相机噪声具有信号依赖性和ISP非线性变换特性，导致模型在真实数据上泛化性能差。核心问题：相机ISP流程(如去马赛克、色彩校正)会改变RAW域噪声的时空-色度相关性，使其分布偏离高斯。

图1：DND数据集真实相机图像去噪效果

CycleISP框架创新

1. 核心贡献

设备无关的RAW-sRGB双向转换
提出无需相机ISP参数的CycleISP模型，通过RGB→RAW→RGB循环学习实现数据合成与噪声建模：
- RGB2RAW模块：将sRGB逆转换为RAW数据，无需依赖白平衡增益等相机参数
- RAW2RGB模块：通过颜色注意力单元自适应不同相机色彩特性，重建sRGB图像
真实噪声合成器
在RAW域注入物理噪声模型：
- 包含光子散粒噪声(光照依赖)、读出噪声(电路精度相关)、固定模式噪声(传感器缺陷)
- 支持动态参数校准，适配不同ISO和量子效率的传感器
轻量双重注意力机制
去噪网络参数量仅2.6M(对比UPI的11.8M)，通过：
- 通道注意力：抑制噪声传播
- 空间注意力：增强纹理重建