深度学习
文章平均质量分 87
Cyiano
深度学习小萌新一只
展开
-
目标检测 Fast R-CNN 论文笔记
此篇文章是 Ross Girshick 大牛在微软研究所单撸出来的一篇文章。基于14年 R-CNN 的大获成功,作者提出了其改进算法 Fast R-CNN 。Fast R-CNN 在VGG16 network下训练速度比R-CNN快了9倍,测试时间更是缩短了213倍,不仅如此,mAP也达到了最高水平。原创 2017-04-12 13:44:17 · 2692 阅读 · 2 评论 -
Tensorflow slim库使用小记
Tensorflow slim库使用小记slim库是tensorflow中的一个高层封装,它将原来很多tf中复杂的函数进一步封装,省去了很多重复的参数,以及平时不会考虑到的参数。可以理解为tensorflow的升级版。导入方式:import tensorflow as tfimport tensorflow.contrib.slim as slim常用函数slim.conv2dslim.conv2原创 2017-07-12 10:54:47 · 26029 阅读 · 13 评论 -
ICCV2017论文“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks” 阅读笔记
ICCV2017论文“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks” 阅读笔记题目:Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks作者:Jun-Yan Zhu, Taesun原创 2017-09-07 15:47:48 · 4522 阅读 · 2 评论 -
Spatial Transformer Networks 论文笔记
Spatial Transformer Networks 论文笔记简介Spatial Transformer Networks和BN一样相当于一个小插件,放在卷积网络中,其主要目的是对齐网络的每个输入。比如MNIST的手写数字识别,如果有一个图像中的数字有一定角度倾斜或偏移,Spatial Transformer可以对输入图像进行仿射变换,让CNN真正的输入变成对齐后的数字图像。 网络网络结原创 2017-10-27 19:26:16 · 1472 阅读 · 0 评论 -
Real-Time Video Super-Resolution with Spatio-Temporal Networks and Motion Compensation 论文笔记
Real-Time Video Super-Resolution with Spatio-Temporal Networks and Motion Compensation 论文笔记摘要作者的目的是引进一个spatio-temporal sub-pixel convolution networks,能够处理视频图像超分辨,并且做到实时速度。还提出了一个将动作补偿和视频超分辨联合起来的算法,并且可以原创 2017-10-27 19:26:48 · 6512 阅读 · 2 评论 -
Detail-revealing Deep Video Super-resolution 论文笔记
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记简介视频超分辨关注的主要问题有两个:一是如何充分利用多帧关联信息,而是如何有效地融合图像细节到高分辨率图像中。动作补偿方面,深度学习方法用的是backward warping到参考帧,但这个方法其实并不是最优的。多帧融合方面,虽然很多CNN方法可以产生丰富的细节,但不能确定图像细节是来自原创 2017-10-27 19:27:20 · 6349 阅读 · 4 评论 -
图像超分辨EDSR:Enhanced Deep Residual Networks for Single Image Super-Resolution,论文笔记
图像超分辨EDSR:Enhanced Deep Residual Networks for Single Image Super-Resolution,论文笔记简介作者提出的模型主要是提高了图像超分辨的效果,并赢得了NTIRE2017 Super-Resolution Challenge。做出的修改主要是在残差网络上。残差结构的提出是为了解决high-level问题,而不能直接套用到超分辨这种l原创 2017-11-02 16:59:16 · 19158 阅读 · 9 评论 -
图像超分辨LapSRN:Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution论文笔记
图像超分辨LapSRN:Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution论文笔记简介作者使用的超分辨结构,是拉普拉斯金字塔,每一级的金字塔都以粗糙分辨率的特征图为输入,用解卷积来升采样得到更精细的特征图。另外,网络的训练使用了robust Charbonnier loss function,这个损失函数可以原创 2017-11-13 13:43:43 · 5631 阅读 · 0 评论 -
图像超分辨EnhanceNet- Single Image Super-Resolution Through Automated Texture Synthesis笔记
图像超分辨EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis笔记简介作者写这篇文章,主要是提出了损失函数的改进。传统的损失函数是MSE,虽然很好优化,但它是所有可能的纹路取平均的结果,因此看起来较为平滑,很不自然。因此,作者将提出一个不同的损失函数,联合对抗训练,来提高SISR的感知质量。SI原创 2017-11-23 11:20:13 · 7786 阅读 · 1 评论 -
Video Enhancement with Task-Oriented Flow(TOFlow)
Video Enhancement with Task-Oriented Flow(TOFlow)论文笔记介绍曾经的视频超分辨方法都包含了两个重要的模块:动作估计和超分辨,其中动作估计大都是用CNN推测出光流flow来实现的。推测出光流的目的,主要是为了把输入的几帧图像(It−1,It,It+1It−1,It,It+1I_t-1, I_t, I_t+1)扭曲到同一位置上(It−1−&...原创 2018-03-24 19:41:00 · 4478 阅读 · 0 评论 -
-Zero-Shot-- Super-Resolution using Deep Internal Learning
“Zero-Shot”: Super-Resolution using Deep Internal Learning简介以往的深度学习超分辨方法是基于大量的LR-HR数据来训练一个网络的参数,其中生成LR的方法是用诸如MATLAB的imresize函数,这种LR图像被称为 ideal 的。然而实际情况中要超分辨的LR图像往往有是 non-ideal 的:掺杂噪声、未知的降采样核、有ali...原创 2018-04-03 11:26:38 · 4347 阅读 · 5 评论 -
Deep Back-Projection Networks For Super-Resolution
Deep Back-Projection Networks For Super-Resolution简介近年来提出的超分辨网络多为前馈结构,学习HR和LR的非线性映射。然而,这些方法不能解决LR和HR的相互依赖关系(address the mutual dependencies of low- and high-resolution images)。之前的研究表明,人类的视觉系统可...原创 2018-04-04 11:11:35 · 3159 阅读 · 0 评论 -
图像分割论文 Fully Convolutional Networks for Semantic Segmentation 阅读笔记
图像分割论文 Fully Convolutional Networks for Semantic Segmentation 阅读笔记原文:Fully Convolutional Networks for Semantic Segmentation作者:Jonathan Long,Evan Shelhamer,Trevor Darrell下载地址:https://arxiv.org/abs/160原创 2017-07-27 15:19:42 · 3035 阅读 · 0 评论 -
CVPR2017最佳论文 Densely Connected Convolutional Networks (DenseNets)阅读笔记
CVPR2017最佳论文 Densely Connected Convolutional Networks (DenseNets)阅读笔记原文:Densely Connected Convolutional Networks作者:Gao Huang, Zhuang Liu, Kilian Q. Weinberger, Laurens van der Maaten下载地址:https://arxi原创 2017-08-03 15:46:44 · 5294 阅读 · 0 评论 -
目标检测 R-CNN 论文笔记(Rich feature hierarchies for accurate object detection and semantic segmentation)
目标识别与检测数据库:PASCAL VOC在12年以前一直进展缓慢,一些新提出的优化方法只是把之前的方法线性地结合在一起。Ross Girshick提出的R-CNN直接将识别准确率提高了30%。作者主要利用两个因素:一个是CNN可以应用于区域候选,以便定位和分割物体;另一个是当标记的训练数据很少时,辅助任务的预训练加以fine-tuning,可以显著提高性能。原创 2017-04-10 15:48:46 · 3694 阅读 · 0 评论 -
目标检测 Faster R-CNN 论文笔记
目标检测 Faster R-CNN 论文笔记论文名称:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks,点我下载Faster R-CNN算法基于R-CNN和Fast R-CNN改进得来,如果你对它们尚不了解,可以看看 R-CNN 和 Fast R-CNN 的相关知识。0. 摘要R-CNN的提原创 2017-04-13 20:48:28 · 2926 阅读 · 0 评论 -
Tensorflow 学习笔记之 共享变量(Sharing Variables)
Tensorflow 学习笔记之 共享变量(Sharing Variables)最近两年,谷歌撑腰的深度学习框架Tensorflow发展地如日中天,虽然17年pytorch的出现略微“打压”了一些TF的势头,但TF在深度学习界的地位还是难以撼动的,github上TF的收藏量一直稳在深度学习中前二的位置。个人在4月份开始接触TF,写分类、超分辨网络不亦乐乎。然而,最近从越来越多的TF github项目原创 2017-05-23 17:26:50 · 4283 阅读 · 0 评论 -
细粒度图像识别Object-Part Attention Driven Discriminative Localization for Fine-grained Image Classificatio
本文介绍了17年4月在arxiv上的一篇细粒度图像识别文章,由清华大学的Yuxin Peng等人撰写,采用的是弱监督识别方法,准确率达到了最高。原创 2017-05-14 21:16:16 · 12155 阅读 · 13 评论 -
细粒度图像识别算法Mask-CNN 论文笔记
传统的图像识别一般都是识别花、鸟、汽车等不同类别物体,而细粒度图像识别则是要识别同一类物体下的不同子类。举个例子,识别一张图片是猫、狗、汽车还是飞机就是传统的图像识别,而识别一张图片是贵宾犬、边境牧羊犬、吉娃娃还是斗牛犬,则是细粒度图像识别。不同的犬类相似性一般都很高,比如下面的哈士奇和阿拉斯加雪橇犬,如果事先不知道它们有差别的部位,很难正确识别。原创 2017-05-09 11:13:23 · 15866 阅读 · 8 评论 -
细粒度图像识别文章 Picking Deep Filter Responses for Fine-grained Image Recognition 阅读笔记
细粒度图像识别指的是在一个大类中的数个子类进行识别(例如识别不同鸟类的种类),人们通常需要专业的知识才能达到很高的准确率,而普通的图像分类网络在细粒度图像识别方面也是表现欠佳。本博客讲解了一篇CVPR2016上的细粒度识别文章,在鸟类的识别方面准确率达到了84.5%。原创 2017-05-11 14:45:51 · 4394 阅读 · 3 评论 -
目标检测 Feature Pyramid Networks for Object Detection(FPN)论文笔记
目标检测 Feature Pyramid Networks for Object Detection(FPN)论文笔记原文: Feature Pyramid Networks for Object Detection作者: Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belo原创 2017-06-16 09:32:08 · 2594 阅读 · 0 评论 -
深度学习 Batch Normalization 论文笔记
深度学习 Batch Normalization 论文笔记标题: Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift作者: Sergey Ioffe, Christian Szegedy下载地址: http://proceedings.mlr.press/v37/原创 2017-07-10 16:19:01 · 3579 阅读 · 0 评论 -
图像分割、目标检测 MASK R-CNN 论文阅读笔记
图像分割、目标检测 MASK R-CNN 论文阅读笔记原文: MASK R-CNN作者: Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick下载地址: https://arxiv.org/abs/1703.068701 简介作者提出的Mask R-CNN是Faster R-CNN的升级版,以往Faster R-CNN可以实现分类原创 2017-06-22 11:26:53 · 9062 阅读 · 0 评论 -
GoogLe图像分类模型 Inception-v2,Inception-v3 论文笔记
GoogLe图像分类模型 Inception-v2,Inception-v3 论文笔记标题:Rethinking the Inception Architecture for Computer Vision作者:Christian Szegedy,Vincent Vanhoucke, etc.下载地址:https://arxiv.org/abs/1512.005671 简介自2012年Ale原创 2017-07-21 22:08:44 · 5503 阅读 · 0 评论 -
Tensorflow常用函数笔记
Tensorflow常用函数笔记tf.concat把一组向量从某一维上拼接起来,很向numpy中的Concatenate,官网例子:t1 = [[1, 2, 3], [4, 5, 6]]t2 = [[7, 8, 9], [10, 11, 12]]tf.concat([t1, t2], 0) ==> [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]t原创 2017-07-25 17:30:00 · 19383 阅读 · 0 评论 -
Deep Image Prior
Deep Image Prior摘要深度卷积网络已经成为图像生成和重建的常用工具。人们猜想,他们优秀的表现是归功于他们能够从大量图像样本中学习到真实图像先验的能力。而相反,本文中作者展示生成网络在经过任何学习之前就能够捕获大量的低级图像统计信息,也就是说,这些信息可能并不是通过大量的数据集学习得来。文中具体的实验方法,就是用一个随机初始化的生成网络,仅通过给定的图像就能得到重建后的图像...原创 2018-04-17 17:24:31 · 8194 阅读 · 0 评论