00 那些年很火的深度学习
文章平均质量分 92
为什么先生2012
图像大法好
展开
-
deep image prior (cvpr 2018)
deep image prior (cvpr 2018)1 结论:因为网络参数具有高噪声阻抗和低信号阻抗性,相当于给网络w加了一个约束。此时信号收敛的更快,而噪声收敛的较慢,使得前期输出的图像主要是信号相关信息。2 为什么网络参数具有高噪声阻抗和低信号阻抗性? 2.1实践出真理:论文考虑最基本的重建问题:构建网络,输入为固定分布的的随机编码,GT为X,而X为如下四种:一张自然图像A,自然图像A+噪声,被随机破坏的自然图像A,白噪声实验发现,当X为自然图像和加了噪声的自然图像.原创 2020-08-07 17:29:27 · 680 阅读 · 0 评论 -
真实噪声:Densely Connected Hierarchical Network for Image Denoising(CVPRW2019) 阅读理解
Deep Iterative Down-Up CNN for Image Denoising CVPRW2019Densely Connected Hierarchical Network for Image Denoising CVPRW2019相同作者:NTIRE 2019真实图像去噪挑战上Raw和RGB两个赛道分别获得第二第三。效果看还行。整个文章的主体结构:u-net 网络结构 + 通过基于预训练模型实现单个模型处理不同级别的噪声 + 通过自集成策略进一步提升模型效果1...原创 2020-05-10 13:44:09 · 821 阅读 · 0 评论 -
Multi-Scale Boosted Dehazing Network with Dense Feature Fusion(CVPR2020) 阅读理解
Multi-Scale Boosted Dehazing Network with Dense Feature Fusion(CVPR2020)1 简要1作:西安交通大学在本文中,作者团队提出了一种基于U-Net架构的具有密集特征融合的多尺度增强去雾网络。 该方法是基于boosting和误差反馈这两个原理设计的,表明它们适用于去雾问题。1 通过在所提出模型的解码器中加入“Stren...原创 2020-05-03 20:07:17 · 6612 阅读 · 2 评论 -
一文读懂多帧超分辨率来龙去脉2019
人类消除不了混叠信息,最后逼出了多帧超分。1 为什么要超分?与单反相机相比,智能手机相机的传感器更小,这限制了它们的空间分辨率;更小的光圈,限制了它们的聚光能力;更小的像素,这降低了他们的信噪比。实际获得的低分辨率图像可以认为是利用光学成像设备对原始高分辨率场景进行观测的结果,而观测过程不可避免的会受到镜头光学模糊、欠釆样、噪声等降质因素的影响。2 为什么要多帧超分?因为图...原创 2019-11-23 14:54:26 · 5718 阅读 · 1 评论 -
All-in-focus based on Multi-focus Image Fusion 相关文献阅读理解
2018 Unsupervised Deep Multi-focus Image Fusion Xiang Yan2016 Multi-focus image fusion with a deep convolutional neural network Yu Liu2014 Multi-scale weighted gradient-based fusion for multi-foc...原创 2018-10-21 20:34:31 · 2160 阅读 · 1 评论 -
超分:Image Super-Resolution Using Very Deep Residual Channel Attention Networks 阅读理解
这个超分效果,亲测不错,而且作者提出的残差注意网络方便实用。论文认为图像输入和特征中含有丰富的低频信息,这些信息在不同的信道中被平等对待,从而阻碍了cnn的表征能力,因此提出了一种非常深的残差通道注意网络(RCAN)。(1)如何解决更深:当然是利用残差网络,因此基于残差设计了一个非常深的网络,即一个大残差模块中包含多个小的残差模块(RIR:residual in residual)。通过长...原创 2018-12-23 22:04:26 · 3252 阅读 · 0 评论 -
基于CNN的HDR重建(一 多帧的)
这篇文章简要叙述2017-2018 几篇HDR相关的论文,尤其基于CNN的HDR。对于动态场景来说,从一组不同曝光的图像中生成高动态范围(HDR)图像是一个具有挑战性的过程。这个问题可以分为两个阶段:1)对齐输入的LDR图像,2)合并对齐的图像到HDR图像。方法主要分为两类:一种直接基于LDR对齐融合,一种是先通过相机响应函数线性化这些输入图像(一般就是一个单调的非线性函数),将LDR...原创 2019-01-27 08:53:43 · 5922 阅读 · 1 评论 -
基于CNN的HDR重建(二 单帧的)
目录CNN多帧:基于CNN的HDR重建(一 多帧的)CNN单帧:ExpandNet: A Deep Convolutional Neural Network for High Dynamic Range Expansion from Low Dynamic Range Content 2018 EUROGRAPHICSImage Correction via Deep Recipr...原创 2019-01-27 09:01:53 · 3384 阅读 · 0 评论 -
A High-Quality Denoising Dataset for Smartphone Cameras 阅读笔记
该论文提出了一种制作真实噪声图像对应的ground truth的方法,并基于该方法提出了一个高质量智能手机去噪数据集。目前智能手机图像去噪是一个活跃的研究领域,但是目前该领域缺乏一个高质量的数据集,即真实的噪声图像和对应的高质量 ground truth.本文设计了一种产生高质量智能手机图像去噪数据集SIDD。使用5个具有代表性的智能手机摄像头,在10个不同光照条件下,从10个场景中获取约30...原创 2019-03-03 10:25:30 · 1477 阅读 · 0 评论 -
Learning a Single Convolutional Super-Resolution Network for Multiple Degradations(CVPR2018) 阅读理解
我们提出了一个简单但有效且可扩展的deepCNN框架为SISR。该模型超越了广泛使用的双三次退化假设,适用于多种甚至是空间变化的退化,为开发一种实际应用的基于cnn的超解析器迈出了实质性的一步; 针对LR输入图像、模糊核和噪声之间的维数不匹配问题,提出了一种新的维数拉伸策略。虽然这个策略是为SISR提出的,但它是通用的,可以扩展到其他任务,如去模糊。如下图,感觉这个...原创 2019-03-30 11:56:34 · 1053 阅读 · 4 评论 -
超分走进真实数据
NTIRE 2019 Challenge on Real Image Super-Resolution随着NTIRE 2019 关于真实数据进行单帧超分的比赛结束,2019 年关于超分有两个关键词,“远近数据对” 和 Raw数据:1 人们开始通过长远焦或者远近拍摄来构建真实的超分数据,即退化模型不再是通过下采样和上采样来构建数据集或者人为进行模糊。2 人们不再基于RGB进行单帧超分...原创 2019-07-07 16:18:09 · 2448 阅读 · 0 评论 -
Scale-recurrent Network for Deep Image Deblurring 阅读理解
Scale-recurrent Network for Deep Image Deblurring 2018CVPR 腾讯优图出品code https://github.com/jiangsutx/SRN-Deblur 代码亲测效果确实不错,但是对于我自己拍的照片出现bad case,跟作者确认过,确实存在。可能是因为作者的模型主要针对运动模糊,一般失焦模糊容易受到矫枉过正的问题。总之...原创 2018-10-13 16:33:52 · 2342 阅读 · 2 评论 -
00 caffe-学习笔记
Caffe本文是我刚刚开始学习caffe时参考caffe的官网的教程时所作的个人笔记,初步接触,理解不是很透彻,如果有误希望指出。windows10+VS2013—Matab2016+python2.7windows用户爱好者: BVLC和Microsoft提供了windows下caff的配置,非常方便。 BVLC版, Microsoft版。本人是用的BVLC版的,具体CommonSettin原创 2016-10-14 09:01:15 · 1742 阅读 · 0 评论 -
LSTM解析
LSTM 理解 Long Short-Term Memory(LSTM) 是一种循环神经网络(Recurrent Neural Network, RNN) Sepp Hochreiter和Jürgen Schmidhuber早在1997年就在论文“Long Short-Term Memory”提出了LSTM。LSTM 的关键就是细胞状态,水平线在图上方贯穿运行。 LSTM 通过精心设计的称作为原创 2018-01-02 22:22:11 · 2801 阅读 · 0 评论 -
Deep Hash in Large Scale Image Retrieval
Deep Hash in Large Scale Image Retrieval 深度哈希方法及其在移动视觉搜索中的应用 大规模图像检索的利器Deep哈希算法介绍 Learning to Hash这里介绍两篇深度hash文章 01 Simultaneous Feature Learning and Hash Coding with Deep Neural Networks CVPR2015原创 2018-01-21 10:07:14 · 1671 阅读 · 0 评论 -
文字检测与识别大纲:未完待续
论文文献整理【持续更新】文字检测与识别资料整理(数据库,代码,博客)【持续更新】文字检测与识别资源2018-03-14 文字检测与识别 未完待续个人总结:自然场景文字识别文字检测:端到端的文本区域检测(1)水平文字检测比较好的算法是2016 ECCV乔宇老师团队的CTPN(2)倾斜文字检测比较好的方法是2017 CVPR的EAST和Seglink...原创 2018-03-14 22:33:51 · 465 阅读 · 0 评论 -
译文:Faster R-CNN
【翻译】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal NetworksShaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun摘要: 目前最先进的目标检测网络需要先用区域建议算法推测目标位置。像SPPnet[7]和Fast R-CNN[5]这些网络已翻译 2018-03-01 22:59:52 · 841 阅读 · 0 评论 -
Faster R-CNN 学习笔记
Faster RCNN 学习 Faster R-CNN这篇论文着重解决了这个系统中的三个问题: 1. 如何设计区域生成网络;RPN 2. 如何训练区域生成网络; 3. 如何让区域生成网络和Fast RCNN网络共享特征提取网络。 图1:Faster RCNN 结构Faster RCNN: 1. Faster RCNN 由两部分组成:提取候选框和Fast R-CNN 检测器 2...原创 2018-03-03 16:55:15 · 1384 阅读 · 0 评论 -
02Faster R-CNN解析
Faster RCNN 解析 Faster R-CNN这篇论文着重解决了这个系统中的三个问题: 1. 如何设计区域生成网络;RPN 2. 如何训练区域生成网络;关于anchors的回归和分类(二分类,前后景)(Region Proposals初步调整) 3. 如何让区域生成网络和Fast RCNN网络共享特征提取网络。对目标Region Proposals 进行边框回归和分类(类别很多:例...原创 2018-03-04 09:50:08 · 530 阅读 · 0 评论 -
译文:Detecting Text in Natural Image with Connectionist Text Proposal Network
译文:【ECCV2016】Detecting Text in Natural Image with Connectionist Text Proposal Network Zhi Tian1, Weilin Huang 1;2, Tong He1, Pan He1, and Yu Qiao1;3摘要: 我们提出了一个新颖的CTPN网络,这个网络模型可以有效地进行自然场景文本行的区域定位。这个翻译 2018-02-03 21:56:41 · 1133 阅读 · 0 评论 -
《Recursive Recurrent Nets with Attention Modeling for OCR in the Wild》 笔记
该文提出了一个基于注意力模型的递归循环神经网络模型(R2AM),解决在在无字典约束的条件下,对自然场景文字进行识别.提出的模型主要有以下几个优点:(1)采用了循环的CNN网络,可以更加有效和准确地提取图像特征;(2)在一个隐式的字符级别识别模型中嵌入一个RNN网络可以避免去使用N-元分析法;(3)采用软注意力机制可以允许模型选择性的利用特征,并且运行采用标准的BP算法进行端到端的训练。 ...原创 2018-05-01 20:51:22 · 854 阅读 · 0 评论