CycleISP: Real Image Restoration via Improved Data Synthesis_CVPR2020

写在前面
这篇文章看到多方评价都说效果很好,是

Abstract

1、提出一个模拟 ISP 处理的模型(模型是怎么构建的?)
2、在 RAW、sRGB 域都能生成图像对,都能做去噪。(它说在真是图像基准数据集上有 SOTA 效果,不会是 DND 吧)
3、参数量是之前的RAW去噪最佳方法(用的什么方法?)参数的 1/5

1、Introduction

(要长脑子了)
高层视觉问题:图像分类、目标检测、目标分割
底层视觉问题:图像去噪、超分、去模糊

本文工作是什么?

想在 raw 图上叠加噪声
raw 噪声和信号相关,去马赛克后和空间色彩相关,ISP走完噪声可能不再满足高斯分布
Unprocessing 的不足:需要目标相机设备的先验信息(CCM颜色校正矩阵、白平衡增益)——这就意味着需要一个事先调好的ISP欸!泛化性不足,不推荐使用。

看看白平衡增益的代码,这个用了什么参数

本模型厉害的是:不需要相机参数先验,实现sRGB和raw的转换

本文贡献
1、建立 CycleISP 模型,可实现 sRGB 和 RAW 的变换(听起来取代了 ISP 流程)
2、真实图像噪声合成器,可获得图像对
3、双重注意力机制CNN,在CycleISP、合成图像噪声、去噪中都有应用
4、在 DND、SIDD 数据集上 SOTA ,网络参数大大减少,只有 2.6M

2、RelatedWork

pass now

莫林的思考
1、模型用什么数据进行训练?
2、模型训练好之后,用什么数据进行测试?

3、CycleISP

真实的噪声数据集是人工合成的!

看懂网络结构设计思路(暂缓,等论文复现需要了解实现细节再看

多个 branch:RGB2RAW、RAW2RGB、RAW2RGB 中有颜色校正网络、叠加噪声模块(ON/OFF)
训练方式:RGB2RAW、RAW2RGB分开训练,然后联合微调

在这里插入图片描述

在这里插入图片描述

这是前文提到的双重注意力机制 CNN

3.1 RGB2RAW

Unprocessing 中也有从 RGB2RAW的部分,如下图所示,阅读代码发现:进行 Unprocessing 需要已知相机参数。
哪些参数来着?——忘记了,手头没有代码,暂时不深入看,但是我记得它需要相机参数信息。
在这里插入图片描述
那本文实现 RGB2RAW 的训练数据是什么?为什么它不需要相机的参数信息?后面做去噪用的又是什么数据呢?

仔细阅读论文,作者只是给出了模型架构方式,不讲上述核心信息。——没有这些信息模型训练不起来啊!

通过论文代码进行反向分析
1、作者训练得到了 RGB2RAW 的合理权重(TBD),用这个权重去对新输入的 RGB 数据生成 RAW 图。

RGB 域的去噪作者是如何实现的?


4、Synthetic Realistic Noise Data Generation 合成的真实噪声数据生成方式

叠加人为生成的噪声:add shot、read noise——移植了 Unprocessing 代码
如何对模型进行微调:用 SIDD 的数据,叠加真实噪声

5、Denoising Architecture

pass

6、Experiments

暂缓


文章实现思路总结

大概想清楚了模型的运行逻辑,从终点反向推到起点。我的两个目标及对应的解决办法

1、RGB 域去噪
目标:输入 RGB_noisy,输出 RGB_clean

1.1 模型训练一定需要用到的数据:RGB_clean、RAW_clean

1.2 模型训练要得到的东西:RGB2RAW 的权重、 RAW2RGB 的权重

1.3 对 RAW_clean 人为添加噪声,并经过 RAW2RGB 获得 RGB_noisy

1.4 用 RGB_clean 和 RGB_noisy 训练得到 RGB 域去噪的模型权重

1.5 用真实的 RGB 域噪声图验证上述去噪模型效果好坏。

2、RAW 域去噪
目标:输入 RAW_noisy,输出 RAW_clean

2.1 模型训练一定需要用到的数据:RGB_clean、RAW_clean

2.2 模型训练要得到的东西:RGB2RAW 的权重、 RAW2RGB 的权重

2.3 对 RAW_clean 人为添加噪声,获得 RAW_noisy

2.4 用 RAW_clean 和 RAW_noisy 训练得到 RAW 域去噪的模型权重

2.5 用真实的 RAW 域噪声图验证上述去噪模型效果好坏,大概率经过 RAW2RGB 的处理,在 RGB 域看效果。


PPT要点一览

1、为什么用合成的方式做图像去噪

2、深度学习方法在真实数据上泛化性能较差

[正文摘抄] On synthetic datasets, existing deep learning based denoising models yield impressive results, but they exhibit poor generalization to real camera data as compared to conventional methods

下文是两篇综述文章的总结,补完文章以加深对这篇文章的理解
在这里插入图片描述

3、ISP 的 pipeline

在这里插入图片描述
做色调映射后色彩就很丰富了。
RGB域图像噪声的特点:1、空间和色度相关2、信号相关;3、不一定是高斯
在这里插入图片描述

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值