【Deep Stacked Hierarchical Multi-patch Network for Image Deblurring】阅读笔记

本文提出了一种新的端到端CNN模型,名为分层多块网络(DMPHN),用于图像去模糊。该模型借鉴了空间金字塔匹配的概念,从精细到粗略的尺度上执行去模糊,并通过残差学习优化各层的专注领域。此外,还引入了新的叠加方法克服深度去模糊模型的限制,并提出了一种内存友好的网络变体。实验表明,该方法在保持较低计算成本的同时提高了去模糊性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. Contribution

本篇论文在归纳时,仍将当前基于CNN的去模糊方法归纳为两种形式,多尺度和尺度递归。认为这两种方案是将”从粗到精”方案扩展到深度CNN场景。尽管如此,仍存在许多挑战:

  • 在粗到精方案下,由于滤波器尺寸较大,大多数网络使用大量训练参数。因此,多尺度和尺度递归方法导致昂贵的运行时间,并且难以改善去模糊质量。(这一点在有篇论文里使用多层小卷积核代替单层大卷积核,从而减少了参数量)
  • 在多尺度方法中增加极低分辨率输入的网络深度似乎不会改善去模糊性能。

贡献点:

  • 提出了一种类似于空间金字塔匹配(SPM)的端到端CNN分层模型,该模型在从细到粗的网格中执行去模糊,从而利用多块局部到粗操作。每个较精细级别通过将其残差图像贡献给较粗糙级别以残差方式起作用,从而允许网络的每个级别聚焦在不同的模糊尺度上。
  • 确定了当前深度去模糊模型对叠加深度的限制,并介绍了克服这一限制的新叠加方法。
  • 我们研究了编码器-解码器对之间的权重共享对层次结构的影响,并提出了一种DMPHN的内存友好型变体。

1.1 Encoder-decoder Architecture

编码器结构同之前的两篇文章也有很大的相似的地方。尽管原文没有明说,但是从encoder-decoder的结构中可以看出,采用的基本模块仍然是ResBlock,即ResNet原基本单元去掉BN和最后一层ReLu的结果。

和纯粹堆叠ResBlock(多尺度去模糊那篇论文)不同,借鉴了尺度递归那篇文章的结构,即在每一个基本模块前添加一个卷积层。

通道数的策略基本不变,依此经历3-32-64-128-128-64-32-3的变化。再有的变化就是卷积核的尺寸变成了3*3,减小了参数量。在原来两篇论文中都采用的较大尺寸的卷积核。

连续3年的论文说明,这几年采用的encoder-decoder框架都是极其相似的,但也都是微调的结果。

1.2 Network Architecture

同之前的多尺度和尺度递归的网络结构不同,本文提出是一种被称为分层多块的网络结构。原文称这一块借鉴了文章【Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories】IEEE 2006,原文章是用于自然场景分类的,在处理的过程中将一张图片分成多个patch,然后分别对每个patch进行特征的提取处理,再将不同的patch组合起来。

现在想想VIT的做法有点借鉴这种做法的意思。从时间年限来看,VIT提出的时间是2020年,也就是说本论文应该不是受到了VIT的做法而得到的启发;应该就是从更早的2006年的SPM文章中得到的启发。

因此,这一部分最大的特点就是对原图打patch,使得一张图片可以分成如1,2,4,8个patch的图片,认为同一张图在打成不同的patch的情况下属于不同的尺度。不同的是,这里认为处理的是从精到粗,处理的顺序是先从patch多的开始处理,处理后将左右相邻的两个小patch融合,成为和上一尺度的一个patch相同大小的patch。

在特征融合方面,上面的表述已经说明了在不同尺度输出后,会和上一尺度的输入进行融合;该网络结构的另一处特征融合体现在中间特征的融合,中间特征的产生,认为是本层尺度经过特征提取后与下层中间特征的加和。这就需要考虑形状的问题。下层中间特征的形状已经是输入时的patch扩大后的结果了。patch的扩大都是在最后一步进行的操作,在之前的操作中,patch大小保持不变。

1.3 Stacked Multi-Patch Network

在多尺度论文中,图像金字塔采用了三个尺度的图像,这就不禁让人联想到为什么仅采用了三个尺度,更多的尺度能否有效,事实上据说使用更小的尺度会导致精度提高很小,但参数量增大较多的情况。

本文提出的方案也有类似的现象,具体表现为,倘若给一张图片打上更多的patch,即每一个patch如果更小的话,对精度的提升也就很小了,因此本文针对这样的现象提出了一个新颖的堆叠策略,来进一步提高模型效果。这一策略就是不再对单一的一个DMPHN进行深度或尺度的拓展,而是想办法堆叠多个DMPHN进行工作。具体分为两种堆叠方式。

Stack-DMPHN:这种方式相当于是对DMPHN进行直接的级联,即第一个DMPHN的输出作为第二个DMPHN的输入,呈串联结构。但也会将前一个DMPHN不同尺度的信息传给下一个DMPHN相应的尺度。

2. Loss

2.1 单一结构

这里的Loss仅采用了最后一个尺度,即最终恢复出潜在图像部分的Loss,而不是像之前论文中对每个尺度的Loss都进行了计算。经文章分析是这样的,这里想采用的是类似残差式的学习,也就是说它不必要求前几个尺度都要恢复出和gt一致的图片。

2.2 堆叠结构

堆叠结构的Loss是将每一个子模型的输出的Loss进行求和,加入堆叠两次单一结构,就是对两个单一结构输出部分分别求取Loss,将两部分Loss相加。

Experiment

Train

单张NVIDIA Tesla P100 GPU(JDG 3900+)
训练3000epochs
无具体时间

Dataset

GoPro dataset
2103对训练,1111对测试
VideoDeblurring dataset
共71个视频,61个用于训练,10个用于测试

评价指标

  • PSNR
  • SSIM
  • Size
  • Time

相关方法

【Deep multi-scale convolutional neural network for dynamic scene deblurring】CVPR 2017
【Learning a convolutional neural network for non-uniform motion blur removal】CVPR 2015
【Scale-recurrent network for deep image deblurring】CVPR 2018
【Dynamic scene deblurring using spatially variant recurrent neural networks】 CVPR 2018

【作 者】Per Christian Hansen 【出版社】Society for Industrial and Applied Mathematic 【出版日期】October 29, 2006 【ISBN】0898716187 9780898716184 【形态项】9.8 x 6.7 x 0.3 inches 【语 言】English 【价 格】$63.00 Deblurring Images: Matrices, Spectra, and Filtering (Fundamentals of Algorithms 3) (Fundamentals of Algorithms) By Per Christian Hansen Publisher: Society for Industrial and Applied Mathematic Number Of Pages: 130 Publication Date: 2006-10-29 ISBN-10 / ASIN: 0898716187 ISBN-13 / EAN: 9780898716184 Binding: Paperback “The book’s focus on imaging problems is very unique among the competing books on inverse and ill-posed problems. …It gives a nice introduction into the MATLAB world of images and deblurring problems.” — Martin Hanke, Professor, Institut für Mathematik, Johannes-Gutenberg-Universität. When we use a camera, we want the recorded image to be a faithful representation of the scene that we see, but every image is more or less blurry. In image deblurring, the goal is to recover the original, sharp image by using a mathematical model of the blurring process. The key issue is that some information on the lost details is indeed present in the blurred image, but this “hidden” information can be recovered only if we know the details of the blurring process. Deblurring Images: Matrices, Spectra, and Filtering describes the deblurring algorithms and techniques collectively known as spectral filtering methods, in which the singular value decomposition—or a similar decomposition with spectral properties—is used to introduce the necessary regularization or filtering in the reconstructed image. The concise MATLAB® implementations described in the book provide a template of techniques that can be used to restore blurred images from many applications. This book’s treatment of image deblurring is unique in two ways: it includes algorithmic and implementation details; and by keeping the formulations in terms of matrices, vectors, and matrix computations, it makes the material accessible to a wide range of readers. Students and researchers in engineering will gain an understanding of the linear algebra behind filtering methods, while readers in applied mathematics, numerical analysis, and computational science will be exposed to modern techniques to solve realistic large-scale problems in image processing. With a focus on practical and efficient algorithms, Deblurring Images: Matrices, Spectra, and Filtering includes many examples, sample image data, and MATLAB codes that allow readers to experiment with the algorithms. It also incorporates introductory material, such as how to manipulate images within the MATLAB environment, making it a stand-alone text. Pointers to the literature are given for techniques not covered in the book. Audience This book is intended for beginners in the field of image restoration and regularization. Readers should be familiar with basic concepts of linear algebra and matrix computations, including the singular value decomposition and orthogonal transformations. A background in signal processing and a familiarity with regularization methods or with ill-posed problems are not needed. For readers who already have this knowledge, this book gives a new and practical perspective on the use of regularization methods to solve real problems. Preface; How to Get the Software; List of Symbols; Chapter 1: The Image Deblurring Problem; Chapter 2: Manipulating Images in MATLAB; Chapter 3: The Blurring Function; Chapter 4: Structured Matrix Computations; Chapter 5: SVD and Spectral Analysis; Chapter 6: Regularization by Spectral Filtering; Chapter 7: Color Images, Smoothing Norms, and Other Topics; Appendix: MATLAB Functions; Bibliography; Index
回答: 在引用的论文中,"scale-deep"是指在图像去模糊任务中使用的一种多尺度和多层级的描述符。这个描述符是通过将每个阶段生成的特征连接起来形成的,并使用层次注意机制来调整特征的权重。通过计算特征的平均强度来衡量可分辨性,并使用全连接层获取可训练的注意力图。最终,通过使用残差图来保存主要的多尺度和多层级特征。这种方法类似于另一篇论文《Deep Stacked Hierarchical Multi-patch Network for Image Deblurring》,只是在结构上有所展开。\[2\]\[3\] #### 引用[.reference_title] - *1* *3* [论文阅读笔记之——《Scale-recurrent Network for Deep Image Deblurring》](https://blog.csdn.net/gwplovekimi/article/details/93170926)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [Multi-Scale Deep Feature Fusion for Vehicle Re-Identification翻译(IEEE2020)](https://blog.csdn.net/weixin_42666085/article/details/105492304)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值