Real Image Restoration via Improved Data Synthesis阅读笔记

最新推荐文章于 2024-01-31 16:03:50 发布

来路与归途

最新推荐文章于 2024-01-31 16:03:50 发布

阅读量357

点赞数

分类专栏：论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42233538/article/details/113082271

版权

论文笔记专栏收录该内容

15 篇文章 0 订阅

订阅专栏

图片的两种格式的区别

RGB

RAW

概述

通常的图像去噪算法都是基于添加AWGN合成的数据集进行研究和评估；CNN网路通常在这些合成的数据集上取得了较好的效果，而在实际场景却表现一般，主要由于AWGN不足以对真正的相机噪声进行建模，

真正的相机噪声是依赖于信号，并经过相机成像通道进行严格的转换（因此，图像噪声跟相机的参数十分相关）；

论文提出了一个网络可以对相机成像通道进行前向和反向建模

简介

高级视觉任务（图像分类、物体检测、语义分割）由于CNN网络已经取得了巨大的进步，主要得益于巨大的数据集，而对于低级视觉任务（图像去躁、超分辨重构、去模糊）获取数据集相当困难，对于单图像去噪目前主要是通过在原图上添加AWGN噪声来构造数据集，由于无法模拟真实场景的噪声，导致在构造数据集上表现较好的模型，在实际中表现一般；

在RGB空间构建噪声相对于RAW空间更难

论文提出一种数据集合成方法，可以在RGB和RAW两个空间中生成真实的图像噪声，

论文提出一种模型CycleISP可以将RGB图像转变为RAW图像，并可以逆向将RAW图像转变为RGB图像

CycleISP实现方法

网络训练过程：分别训练RGB2RAW和RAW2RGB两个网络，然后进行联合训练

RGB2RAW分支

数码相机采用一系列操作将RAW图像转变为RGB图像，RGB2RAW网络的目的是对相机通道逆向建模，

实现步骤：

1.使用M0——卷积操作进行特征提取：

2.通过n个RRG网络提取深度特征：

RRG——Recursive Residual Group

RRG网络包含P个DAB网络；

DAB网路抑制不重要的信息，让重要的信息通过；

采用通道注意力机制（CA）和空间注意力机制（SA）实现

CA:学习通道间的依赖关系；squeeze operation(global average pooling，变换后形状1*1*C)+excitation operation(2个卷积层，并使用sigmoid作为激活函数)+对输入特征图U使用s进行变换

SA:学习特征图的空间依赖关系；采用（global average pooling和max average pooling）生成一个空间描述特征图H*W*2+卷积、sigmoid生成空间注意力特征图

3.使用M1——卷积操作生成大小为H*W*3的图像：

生成3通道的图像的优点：保留尽可能多的原始图像的信息；
有助于更快、更精确的学习特征图

4.使用Bayer sampling function生成RAW格式图像：

5.网络优化

采用L1正则化和log函数计算损失（log函数相当于对图像的像素进行归一化化，避免高亮度区域像素给网络带来的影响）

RAW2RGB

首先，我们先了解如何根据清晰的RAW图像生成清晰的RGB图像

实现步骤：

分为三步：生成RAW到RGB对应的特征图（对应步骤1-4），进行特征空间校正，生成最终的RGB图

1.以RAW相机原图作为输入，H*W*1

2.将RAW图像的2*2区域映射到4通道RGGB中,尺寸变为H/2*W/2*4

3.通过M2——卷积操作

4.K-1个RRG模块生成特征图

5.color attention unit

对于所有的类型的相机，使用一个CNN网络精确的实现RAW到RGB的映射十分困难，论文提出使用color attention unit，通过颜色校正分支提供精确

高斯模糊（确保仅有颜色信息进入该通道）+M3卷积层+2个RRG+M4门控机制+sigmoid激活函数

6. 1个RRG网络+M5卷积操作+Mup上采样

7.通过L1正则化进行模型训练

两个网络的联合训练

噪音的生成

生成RAW噪声图：通过RGB2RAW生成干净的RAW格式的图片，然后通过噪音模块添加噪音

生成RGB噪声图：将合成的RAW噪音作为输入通过RAW2RGB网络生成RGB带噪声的图像

图像去燥

来路与归途

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Real Image Restoration via Improved Data Synthesis阅读笔记

图片的两种格式的区别RGBRAW概述通常的图像去噪算法都是基于添加AWGN合成的数据集进行研究和评估；CNN网路通常在这些合成的数据集上取得了较好的效果，而在实际场景却表现一般，主要由于AWGN不足以对真正的相机噪声进行建模，真正的相机噪声是依赖于信号，并经过相机成像通道进行严格的转换（因此，图像噪声跟相机的参数十分相关）；论文提出了一个网络可以对相机成像通道进行前向和反向建模简介高级视觉任务（图像分类、物体检测、语义分割）由于CNN网络已经取得了巨大的进步，主要得益于巨大的
复制链接

扫一扫

专栏目录

来路与归途

博客等级

码龄6年

245
原创

210
点赞

1234
收藏

100
粉丝

关注

私信

热门文章

分类专栏

面试 42篇
算法导论 25篇
pytorch 3篇
工程实践 11篇
Transformers 1篇
k-means
Canopy
搜索引擎 2篇
数据库 4篇
论文笔记 15篇
数据集 2篇
Tkinter 2篇
强化学习 1篇
GAN 2篇
CV2 1篇
随机数 3篇
python 62篇
tensorflow 31篇
机器学习 11篇
爬虫 1篇
算法思想 13篇
文件读取 3篇
numpy 1篇
3D点云 3篇
软件安装 3篇
Faster R-CNN 5篇

最新评论

tkinter窗口切换
m0_57781693: import tkinter as tk
tkinter窗口切换
m0_57781693: from tkinter import ttk
公交车-最短路径
CSDN-Ada助手: 如何使用模拟退火算法对复杂问题进行求解？
n个花园最少多少天完成种花
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
torch报错
小珑gg22mm: 不是叫你测试，是叫你怎么解决

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。