自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 深度学习——QSNet

原论文:Deep Image Deraining Via Intrinsic Rainy Image Priors and Multi-scale Auxiliary Decoding1.主要内容:根据含雨图像的内在稀疏性先验知识和多尺度特征,提出了单幅图像去雨网络方案。第一,通过大量的统计学实验,文章探索了含雨图像的内在稀疏特性,然后根据稀疏性的先验知识设计了新的损失函数来训练神经网络。利用内在稀疏性能够将雨线完整地分离出来并保留背景图像细节特征。为了进一步简化稀疏性公式,文章提出了准稀疏性。其具备更

2021-04-03 16:46:22 747 1

原创 深度学习——Multi-Purpose Image Deraining (MPID)

CVPR2019原论文:Single Image Deraining: A Comprehensive Benchmark Analysis项目地址:https://github.com/lsy17096535/Single-Image-Deraining1.主要内容:提出了多任务去雨评价标准。对一些优秀去雨方法作了全面的一致性评测。2.雨模型:1)包含雨线和干净背景的雨模型:其中,B为干净背景图像,S为雨线图像。2)包含雨点和干净背景的雨模型:其中,B为干净背景,D为雨点图像,M是雨点的

2021-04-01 17:53:39 2134 1

原创 深度学习——注意力机制

什么是注意力机制?人第一眼看上面的图会首先注意到鹰,而不会太重视天空背景。然而,计算机在处理图像的时候是所有的图像内容同等看待,不会重点关注比较重要的信息。因此,人们提出了一种注意力机制,使计算机系统也能够关注重点信息而忽略不重要信息。系统学会注意力——忽略无关信息而关注重点信息,提高处理效率和质量注意力机制分为两类:软注意力:关注区域或通道,具有确定性,可微性,能够用于网络学习的反向传播。强注意力:关注每一个点,每一个点都可能延伸成重点区域,并且是动态变化的,故而具有不确定性,不可微性,主要用.

2021-03-09 15:54:06 3393

原创 深度学习——Domain Adaptation for Image Dehazing

CVPR2020原论文:Domain Adaptation for Image Dehazing开源代码(pytorch框架):https://github.com/HUSTSYJ/DA_dahazing1.主要内容:提出了领域适应的单幅图像去雾网络。能够有效在合成数据集合和真实数据集的差异之间建立联系。利用人工合成数据集训练,同时利用真实图像数据集参与训练,使得网络对人工合成图像和真实图像都具备较好的去雾能力。(领域适应:指深度网络利用人工合成数据集训练的同时,能够在真实图像数据集领域中有较好的泛

2021-03-07 19:17:15 1022

原创 深度学习——Noisier2Noise

CVPR2020原论文:Noisier2Noise: Learning to Denoise from Unpaired Noisy Data1.主要内容:针对图像去噪声,提出了一种无需ground truth的训练神经网络的方法。该方法对高斯噪声和空间相关性噪声都有效。2.Noisier2Noise方法对于没有ground truth的单幅图像降噪,我们很难直接预测估计噪声。例如,未知噪声模型的噪声X。文章提出了估计未知噪声X的方法:设有含有未知噪声X的图像,已知噪声模型A。则对图像添加一个

2021-03-06 22:24:08 1650 6

原创 深度学习——Analysis-Synthesis Networks

CVPR2020原论文:Deblurring using Analysis-Synthesis Networks Pair开源代码(tensorflow框架)https://github.com/adamkau/analysis-synthesis-deblurring1.主要内容:提出了一种新的图像盲去模糊的网络方案。

2021-03-06 17:10:54 1229 5

原创 深度学习—— Scale-aware Semantic Image Segmentation

CVPR2016原论文:Attention to Scale: Scale-aware Semantic image Segmentation源代码(caffe框架):http://liangchiehchen.com/projects/DeepLab.html1.主要内容:提出了多尺度注意力机制的语义分割网络模型。该网络模型具备两大特点:1,运用了多尺度特征 2,运用了注意力机制。运用多尺度特征,网络模型能捕获到不同感受野的上下文特征,这些上下文图像特征对于语义分割十分重要。提取多尺度特征的两

2021-03-02 10:42:25 825 1

原创 深度学习——Residual Attention Network

CVPR2017原论文:Residual Attention Network for Image Classification开源代码(caffe框架):https://github.com/fwang91/residual-attention-network1.主要内容:提出了残差注意力深度模型网络。该网络具有以下特点:1)其由多个注意力模块堆叠而成,每个注意力模块能够捕获不同的注意类型。2)采用残差连接,避免梯度消失,能够扩展很大的深度,且能完成端到端的训练。2.主体结构如上图,有三个At

2021-02-28 22:14:59 506

原创 深度学习——Squeeze-and-Excitation Networks

CVPR2018原论文:Squeeze-and-Excitation Networks开源代码(caffe框架):https://github.com/hujie-frank/SENet1.主要内容:提出了“Squeeze-and Excitation” (SE) block。SE模块能够根据卷积通道之间的相互依赖关系增强网络的特征表现能力,称为特征重校正。...

2021-02-28 14:58:16 571

原创 深度学习——Deep Convolutional Neural Network for Image Deconvolution

原论文(NIPS2014):Deep Convolutional Neural Network for Image Deconvolution开源代码:http://www.lxu.me/projects/dcnn/1.主要工作:将传统图像优化方案与深度神经网络学习方案结合起来,提出了基于分离结构转置卷积的卷积神经网络完成退化图像重建。2.图像退化模型:其中x是初始图像,y是退化图像。α为相机动态范围,k为点扩散函数,n为相机噪声,φ(…)为图像退化函数, ψb(…)为图像压缩损失。3.优化目标

2021-01-14 12:06:32 676

原创 深度学习——CBD-Net

CVPR2019原论文:Toward Convolutional Blind Denoising of Real Photographs开源代码(matlab):https://github.com/GuoShi28/CBDNet1.主要工作:提出了同时考虑异方差高斯噪声和相机内部处理过程因素的真实噪声模型。该噪声模型能够提高降噪的质量。引入了噪声估计子网络,非对称损失函数能够提高模型对真实噪声的泛化能力,同时,合理调整噪声的强度等级实现交互式去噪声。同时采用了人工合成噪声图像和真实噪声图像来训练

2021-01-08 10:44:55 3987

原创 深度学习——auto-encoder for document image binarization

原论文:A selectional auto-encoder approach for document image binarization文档图像的二值化就是将图像的每一个像素点置为0或1,以此来区分背景和前景(字符)。

2021-01-06 19:43:50 301 1

原创 深度学习——Two-Stage GAN for Document Image Binarization

原论文:Two-Stage Generative Adversarial Networks for Document Image Binarization with Color Noise and Background Removal开源代码(pytorch框架):https://github.com/opensuh/DocumentBinarization/1.主要工作:提出了基于GAN网络的文档图像二值化方法(二值化,即正确区分背景和字符)。该方法解决了文档图像多彩色退化问题。(采用四个独立的网

2021-01-05 21:18:54 904 1

原创 深度学习——deep adversarial decomposition

CVPR2020原论文:Deep Adversarial Decomposition: A Unified Framework for Separating Superimposed Images开源代码(pytorch框架):https://github.com/He-jerry/PatchGAN1.主要内容:提出了基于GAN的一致性网络结构完成单幅重叠图像的分离。例如:去雨,去阴影,去反光…由于分离单幅重叠图像是一个病态问题(具有无穷多种可能性解)。文章提出了一种分离标准(Separation-

2021-01-05 10:52:29 560

原创 深度学习——BEDSR-Net

CVPR2020原论文:BEDSR-Net: A Deep Shadow Removal Network from a Single Document Image为了便捷记录文件内容,我们通常直接用手机或相机拍摄文件。由于环境光照的影响,拍摄的图像会产生各种阴影。就文件图像阴影的问题,文章提出了深度学习的方法去阴影。如下图:1.主要工作:首先提出了单幅文件图像去阴影的深度学习网络(Background Estimation Document Shadow Removal Network ,BEDSR

2021-01-04 11:45:06 1350 8

原创 深度学习——Iterative Boost Convolutional LSTM Network

CVPR2020原论文:Single Image Reflection Removal through Cascaded Refinement开源代码(pytorch框架):https://github.com/JHL-HUST/IBCLN1.主要工作:提出了层级优化网络结构(Iterative Boost Convolutional LSTM Network ,IBCLN) 完成真实世界单幅图像去反光。退化图像I=transmission layers(背景) + reflection layers

2021-01-03 16:25:24 621

原创 深度学习——Pre-Net

CVPR2019原论文:Progressive Image Deraining Networks: A Better and Simpler Baseline开源代码(pytorch框架):https://github.com/csdwren/PReNet1.主要工作:提出了逐步优化残差网络 progressive ResNet (PRN)和逐步优化循环网络progressive recurrent network (PReNet)完成图像去雨。这两个网络没有太大差异,只是PReNet比PRN多了一个

2021-01-03 11:56:12 5821 2

原创 深度学习——SEMI

CVPR2019原论文:Semi-supervised Transfer Learning for Image Rain Removal开源代码(tensorflow框架):https://github.com/wwzjer/Semi-supervised-IRR1.主要工作:提出了半监督迁移学习网络完成单幅图像去雨。该网络采用半监督迁移学习,能够利用单幅真实含雨图像(没有ground truth 图像)进行训练。由于很难获取真实含雨图像的ground truth,大部分去雨网络方案都是采用人工合成的

2021-01-02 19:56:34 557

原创 深度学习——UMRL

CVPR2019原论文:Uncertainty Guided Multi-Scale Residual Learning-using a Cycle Spinning CNN for Single Image De-Raining1.主要工作:提出了不确定性引导的多尺度残差学习(UMRL)网络。该网络利用uncertainty map指导后续的层检测和学习雨纹信息。根据输入生成雨纹图像。在训练和测试阶段,利用循环机制不断提高去雨质量。2.网络主体结构:雨纹是图像中的高频部分(具有明显的边界和轮廓

2021-01-02 12:16:24 1131

原创 深度学习——DRD-Net

CVPR2020原论文:Detail-recovery Image Deraining via Context Aggregation Networks开源代码( tensorflow框架):https://github.com/Dengsgithub/DRD-Net1.主要工作:提出了双分支去雨网络。一个分支为基于压缩激励机制(squeeze-and excitation ,SE)的雨残差估计网络,SE能够获取图像上下文特征信息以完成去雨;另一个分支为图像细节恢复网络,使因去雨导致...

2021-01-01 17:24:49 1190

原创 深度学习——DID-MDN

CVPR2018原论文:Density-aware Single Image De-raining using a Multi-stream Dense Network开源代码(pytorch框架):https://github.com/hezhangsprinter/DID-MDN1.主要工作:

2020-12-31 16:18:16 938

原创 深度学习——RESCAN

原论文2018:Recurrent Squeeze-and-Excitation Context Aggregation Net for Single Image Deraining开源代码(pytorch框架):https://xialipku.github.io/RESCAN1.主要工作:提出了逐阶段去雨的单幅图像去雨深度网络架构。采用逐阶段去雨的方式。每一个阶段采用上下文扩张网络完成去雨工作。最后逐渐优化输出图像。考虑到不同去雨阶段的相关性,文章利用三种循环单元融合了RNN网络架构。前面去雨阶段

2020-12-30 12:07:29 1802 1

原创 深度学习——attentive-gan-derainnet

CVPR2018原论文:Attentive Generative Adversarial Network for Raindrop Removal from A Single Image开源代码(tensorflow框架):https://github.com/MaybeShewill-CV/attentive-gan-derainnet1.主要工作:提出了注意力机制的对抗生成网络完成单幅图像的去雨。最大创新点在于:在生成器网络和判别器网络分别插入注意力机制。在训练过程中,注意力机制能够学习到雨点的区域

2020-12-29 20:36:56 1202

原创 OpenCV——高通滤波器&低通滤波器

1.图像信号分为:高频信号&低频信号高频信号:图像中信号值大的像素点,一般为图像内容实体的边缘轮廓或者噪声低频信号:图像中信号值小的像素点,一般为图像中平滑的部分,包含图像的大部分区域。2.高通滤波器&低通滤波器的作用高通滤波器:保留高频图像信号,去掉低频图像信号。常用于检测图像尖锐、变化幅度大的区域;比如边缘检测,轮廓提取…低通滤波器:保留低频图像信号,去掉高频图像信号。常用图像的平滑操作;比如去掉噪声点…3.常见低通滤波器1)均值滤波器:卷积核为全1,取卷积结果的均值作为中

2020-12-28 11:49:28 2254 5

原创 深度学习——DerainNet

原论文:Clearing the Skies: A Deep Network Architecture for Single-Image Rain Removal1.主要工作:文章提出了DerainNet深度学习去雨方法。DerainNet直接提供了含雨图像和无雨图像之间的非线性映射关系。去雨的同时,利用了图像增强去改善视觉效果。该网络方案不是简单地增加网络复杂度来提升去雨的效果。而是利用图像处理领域的知识去修正目标函数,以提升去雨质量。计算资源消耗少,同时预测输出快。由于无法获取真实世界雨图像的g

2020-12-28 10:56:34 1427 1

原创 深度学习——JORDER

CVPR2017原论文:Deep Joint Rain Detection and Removal from a Single Image1.主要内容:

2020-12-24 11:03:42 1380

原创 深度学习——rain convolutional dictionary network (RCD-Net)

CVPR2020原论文:A Model-driven Deep Neural Network for Single Image Rain Removal 开源代码:https://github.com/hongwang01/RCDNet1.主要内容:利用卷积字典学习机制去编码雨的形状,以及近端梯度技术设计优化算法,提出了单幅图像的雨卷积字典模型(rain convolutional dictionary model,RCD model)。如下图:Rainy Image(O)=Rain

2020-12-21 19:33:33 2459 3

原创 深度学习——Multi-Scale Progressive Fusion Network for Single Image Deraining

CVPR2020论文:Multi-Scale Progressive Fusion Network for Single Image Deraining1.主要内容:提出了多尺度渐进融合网络。实现了单幅图像去雨。该网络通过金字塔表示的方式,利用多尺度图像信息呈现雨纹特征。例如,右边是原始尺度图像,左边是1/2尺度图像。文章指出,同一个尺度图像中,不同位置的雨纹具有相似的结构特征; 不同尺度的图像中,相同位置的雨纹亦有相似的结构特征。因此,我们可以提取、融合多尺度的图像信息,来获取雨纹的特征。为了更

2020-12-18 21:33:26 1888 2

原创 深度学习——Self2Self Net: Self-Supervised Denoising

CVPR2020原论文:Self2Self With Dropout: Learning Self-Supervised Denoising From Single Image1.主要工作:提出了一种自监督学习的单幅图像降噪网络方案(Self2Self)。该方案只需要输入单幅噪声图像(无ground truth)进行训练。有两点核心观点:1)对单幅输入噪声图像进行伯努利采样(如下图,以概率p对图像y进行采样),得到一系列噪声图像。并将采样得到的这些图像用于网络的训练。同时,利用局部卷积代替一般卷积方法

2020-12-17 11:35:59 3462 7

原创 深度学习——Dual Regression Networks for Single Image Super-Resolution(DRN)

CVPR2020原论文:Closed-loop Matters: Dual Regression Networks forSingle Image Super-Resolution1.问题1)低分辨率图像(Low Resulotion)经过非线性映射成高分辨率图像(High Resulotion)本身是个病态问题。因为高分辨率的图像可以任意采样成低分辨率图像,所以其反向变换的非线性映射函数的解空间是非常大的。在这样大的解空间中找到合适的非线性映射函数是十分困难的。2)真实世界无法得到成对的低分辨图像(

2020-12-09 15:00:48 995

原创 深度学习——Metal artifact reduction

原论文:Metal artifact reduction on cervical CT images by deep residual learning1.主要内容:提出了基于卷积神经网络的残差学习方法(RL-ARCNN) 。该方法能够减少颈椎CT图像中的金属伪影(由于人体植入金属部件后,拍CT时会出现放射状伪影)。2.主要步骤:(1)模拟各种金属伪影生成一个数据集,用于训练CNN。此数据集包括含有伪影的图像 (artifact-insert),不含伪影的图像 (artifact-free),伪影图像

2020-12-08 11:37:39 1552 1

原创 深度学习——常用客观参数评价标准

1)均方误差(MSE): 值越小,误差越小。H,W分别为图像高和宽。2)峰值信噪比(PSNR): 值越大,误差越小,即噪声越小。n为像素点值位深度,通常取8。3)结构相似性(SSIM):综合亮度,对比度,结构三方面相似性计算。均值:方差:协方差:亮度相似性:对比度相似性:结构相似性:SSIM:x与y越相似,值越接近1。若权重α,β,γ都取1。则:...

2020-12-06 20:38:45 620

原创 深度学习——超分辨率

原论文:Image Super-Resolution Using Deep Convolutional Networks1.主要步骤:a).模块化特征提取:从图像中交叉重叠地(步长小于卷积核尺寸)提取图像特征信息,其是一个卷积层。并将特征信息(feature map)保存在更高维度的张量中。张量的维度等于该图像的feature map的数量。Y为输入图像,W1为n1个卷积核(尺寸为c* f1* f1,c为通道数,f1为卷积核尺寸),B1为偏移量。max(0,…)即为Relu函数。一个卷积核生成一个

2020-12-06 17:36:48 1523

原创 FPN学习笔记

CVPR2017论文:Feature Pyramid Networks for Object Detection1.主要内容:特征金字塔(表现不同尺度的特征信息)是多尺度目标检测的基础部分。但是其内存消耗和计算量过大。文章提出了自上而下的横向连接结构的网络结构,使特征金字塔的消耗变小,同时能够提取多尺度高级语义特征信息。...

2020-11-12 10:43:30 247

原创 深度学习——Bidirectional Aggregation Network

CVPR2020论文:BANet: Bidirectional Aggregation Networkwith Occlusion Handling for Panoptic Segmentation1.主要内容:提出了双向融合的全景分割网络方案,即Instance-To-Semantic (I2S) 和Semantic-To-Instance (S2I)两个方向,使得语义分割和实例分割之间进行特征交流。运用ROIInlay算子实现了Instance-To-Semantic (I2S)的精确特征映射

2020-11-11 15:40:41 686

原创 深度学习——Dual Super-Resolution Learning

CVPR2020论文:Dual Super-Resolution Learning for Semantic Segmentation1.主要工作:提出了双信息流结构的超分辨率深度学习网络(DSRL网络)。在不增加计算量的情况下,提高语义分割的精度。验证了DSRL网络框架的通用性,它可以很容易地扩展到其他需要高分辨率表示的任务,如人体姿态估计。证明了该方法在语义分割和人体姿态估计方面的有效性。2.主体架构主要分为3部分:(a) Semantic Segmentation Super-Resol

2020-11-09 21:47:23 615

原创 深度学习——DeepNormal

原论文:Deep Normal Estimation for AutomaticShading of Hand-Drawn Characters1.主要内容:提出了一种残差U型网络,该网络能够根据输入的线稿动画图计算得出法向量估计图(Normal Estimation Map)。依据该法向量估计图能够自动进行三维立体渲染,最后得出立体动画图。该方法能够自动生成立体图,不需要人为输入参数。背景意义:如今3D动画等影视艺术作品越来越流行,深受广大人民群众喜爱。同时,3D动画等影视艺术作品也越来越多。但是,

2020-11-06 19:42:57 927

原创 深度学习抠图——手写文本提取

CVPR2020论文:Text Extraction and Restoration of OldHandwritten Documents1.主要内容:a.构建了一个训练用数据集,采用半自动方法生成ground truth。b.提出了重建高质量手稿图像的方法。全卷积自编码器来提取退化图像的字符文本(前景),并用高斯混合模型进行背景重建,最后,将字符文本和背景进行融合生成重建图像。c.提出了第二种改进的图像重建方法。即采用深度卷积网络代替高斯混合模型。...

2020-11-02 21:51:19 1248 3

原创 深度学习——Deep-Masking Generative Network

CVPR2020论文:Deep-Masking Generative Network: A Unified Framework for Background Restoration from Superimposed Images1.主要内容:提出了 Deep-Masking Generative Network (DMGN)对叠加类型噪声图像进行背景重建(如,去雾,去雨,去反光)。首先,同时生成粗略的背景图像和噪声图像,然后,依据噪声图像对粗糙背景图像进行迭代优化,提高背景图像的质量。DMGN的核心是残

2020-10-31 17:51:02 846 2

原创 深度学习抠图——Deep Image Matting

原论文:Deep Image Matting 地址:https://arxiv.org/pdf/1703.03872.pdf

2020-10-29 21:11:12 2374 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除