深度学习
LawenceRay
人生自有浮沉,总要迎着有光的地方向上游...
展开
-
【深度学习论文阅读】GoogLeNet ILSVRC-2014冠军
参考文章:1.GoogLeNet学习心得2.深入理解GoogLeNet结构(原创)3.GoogLeNet的个人理解原创 2019-04-04 14:48:57 · 843 阅读 · 0 评论 -
【图像分割论文阅读】DenseASPP for Semantic Segmentation in Street Scenes
本文由谷歌DeepMotion团队发布,发表于CVPR2018.论文地址:DenseASPP for Semantic Segmentation in Street Scenes背景在自动驾驶领域,语义图像分割是基本的街道场景理解任务,它要求给高分辨率图像分每一个像素点进行分类.由于自动驾驶领域中场景中的目标尺度变化非常大.要求对高层次的特征在多尺度上正确编码.ASPP在获得更大感受...原创 2019-05-30 14:00:04 · 1557 阅读 · 1 评论 -
【图像分割论文阅读】PSPNet:Pyramid Scene Parsing Network
文章来自香港中文大学以及SenseTime集团有限公司.背景场景分割任务是典型的图像分割任务,但是由于场景的多样性以及不受限制的词汇使得场景分割任务仍是一个巨大挑战.当下的SOTA方法是基于FCN的,但是不同的场景以及不受限制的词汇使得正确的分割仍存在许多问题.如下图中第一行,错将红色箭头所指的船舶分类为汽车.一方面是因为两者比较相似,但究其原因在于,当下基于FCN模型的分割方法,缺乏...原创 2019-05-27 19:08:04 · 541 阅读 · 0 评论 -
【图像分割论文阅读】LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation
文章由美国普渡大学Abhishek Chaurasia、Eugenio Culurciello共同完成。发表于2017 IEEE Visual Communications and Image Processing (VCIP),相较之前论文出处,收录文章的会议声名不显。论文地址:LinkNet: Exploiting Encoder Representations for Efficie...原创 2019-06-05 11:12:21 · 1152 阅读 · 1 评论 -
【图像分割论文阅读】ICNet for Real-Time Semantic Segmentation on High-Resolution Images
文章由香港中文大学、腾讯优图实验室、SenseTime研究院联合完成,发表于2018ECCV论文地址:ICNet for Real-Time Semantic Segmentation on High-Resolution Images背景这篇文章聚焦于具有挑战性的实时图像分割任务。实际的应用中如何减少像素级的标签预测时的大量冗余计算仍然十分困难的。作者提出一种Image casca...原创 2019-05-28 16:20:39 · 1184 阅读 · 0 评论 -
【图像分割论文阅读】DeepLabV3+:Encoder-Decoder with Atrous Separable Convolution for SemanticImageSegmentation
本文出自谷歌Liang-Chieh Chen团队,收录于CVPR2018论文地址Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation背景空间金字塔池化SPP以及编解码器Encoder-decoder结构常被用于语义分割任务中。前者以不同比率、不同大小的感受野的卷积池化操作在多尺...原创 2019-05-31 17:17:45 · 1925 阅读 · 0 评论 -
【图像分割论文阅读】OANet:An End-to-End Network for Panoptic Segmentation
本文由浙江大学、旷视科技、华中科技大学、清华大学、东京大学的研究人员共同完成,阵容可谓相当强悍了。本文发表于CVPR2019.论文地址:An End-to-End Network for Panoptic Segmentation本人将CVPR2019关于Segmentation的文章放在云盘了,需要的朋友自取CVPR2019-segmentation,提取密码为:0d8b背景开始说...原创 2019-06-12 19:08:13 · 2012 阅读 · 4 评论 -
【图像分割论文阅读】Efficient ConvNet for Real-time Semantic Segmentation
文章由西班牙阿尔拉卡大学电子系Eduardo Romera等人完成。发表在2017 IEEE Intelligent Vehicles Symposium (IV).论文地址:Efficient ConvNet for Real-time Semantic Segmentation背景自动驾驶是极具挑战性的任务,需要在感知任务中采用复杂的解决方案,如识别道路、交通灯、车辆行人等。但是...原创 2019-06-06 14:52:39 · 1451 阅读 · 0 评论 -
【图像分割论文阅读】RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation
本文由澳大利亚阿德莱德大学、澳大利亚机器人视觉中心联合完成,收录于CVPR2017.论文地址:RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation背景在图像理解中语义分割至关重要。但是成功应用于图像分割、目标检测领域的方法由于频繁的空间池化以及带步长的卷积过程导致最后的输...原创 2019-05-29 13:21:40 · 2845 阅读 · 3 评论 -
【图像分割论文阅读】MNC:Instance-aware Semantic Segmentation via Multi-task Network Cascades
本文出自微软研究院,由清华教授代季峰、何凯明、旷视孙剑三位前辈合力完成。收录于CVPR2016.论文地址:MNC:Instance-aware Semantic Segmentation via Multi-task Network Cascades背景自从FCN提出后综合深度学习特征、大规模注解以及基于图像模型的高级推理,语义分割任务发展迅速。尽管如此,精确快速的实例级语义分割任务...原创 2019-06-03 10:31:06 · 719 阅读 · 0 评论 -
【图像分割论文阅读】The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation
本文出自加拿大蒙特利尔学习算法研究院、蒙特尔理工学院、蒙特利尔伊玛吉亚公司、巴塞罗那计算机视觉中心联合出品。注意到Bengio也在其中。文章最终发表于CVPR2017.论文地址:The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation背景从某种意义上来说,本文的结构...原创 2019-06-04 19:07:50 · 953 阅读 · 0 评论 -
【图像分割论文阅读】APCNet:Adaptive Pyramid Context Network for Semantic Segmentation
本文由深圳计算机视觉与模式识别重点实验室、SIAT-SenseTime联合实验室中国科学院深圳先进技术研究院、上海交大、香港中文大学联合出品。发表于CVPR2019论文地址:APCNet:Adaptive Pyramid Context Network for Semantic Segmentation背景最近的研究表明结合上下文特征能够显著的提升深度语义分割模型性能。这些模型的差异仅...原创 2019-06-16 23:03:32 · 3979 阅读 · 3 评论 -
注意力机制、注意力机制的变体、论文中常见的注意力
前面那篇论文中有提到利用注意力机制进行语义分割的,这里转载一篇。各种注意力总结转载 2019-06-16 23:15:15 · 1302 阅读 · 0 评论 -
【图像分割论文阅读】Building Detail-Sensitive Semantic Segmentation Networks with Polynomial Pooling
本文由电子科技大、中科院信息所、Inception人工智能研究所、北航数字媒体重点实验室共同完成,发表于CVPR2019.论文地址:Building Detail-Sensitive Semantic Segmentation Networks with Polynomial Pooling背景语义分割是计算机视觉领域的中要任务,它试图为输入图像的每一个像素点标定一个语义标签。在训练...原创 2019-06-17 16:29:42 · 900 阅读 · 1 评论 -
【语义分割论文阅读】Decoders Matter for Semantic Segmentation
1.(11)Decoders Matter for Semantic Segmentation论文题目:Decoders Matter for Semantic Segmentation: Data-Dependent Decoding Enables Flexible Feature Aggregation代码地址: 无推荐指数:论文摘要:采用编解码器结构的语义分割方法其解码器的最后一...原创 2019-07-03 17:19:49 · 1302 阅读 · 0 评论 -
【语义分割论文阅读】Context-Reinforced Semantic Segmentation
1.(12)Context-Reinforced Semantic Segmentation论文题目:Context-Reinforced Semantic Segmentation代码地址:无推荐指数:★★★☆☆论文摘要:最近的研究表明上下文在基于深度卷积神经网络的语义分割中的重要性。其中,预测分割图p-map对丰富的高级语义线索进行编码,这是一种有前景的上下文来源。本文在不增加任何新...原创 2019-07-09 11:20:42 · 1363 阅读 · 1 评论 -
【图像分割论文阅读】DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation
1. (23) DFANet论文题目:DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation代码地址:unofficial pytorch implementation of DFANet推荐指数:★★★★☆论文摘要:旷视提出的用于实时语义分割方案DFANer,包含三部分:轻量级backbone、子网络、子...原创 2019-07-04 22:06:07 · 2411 阅读 · 1 评论 -
【图像分割论文阅读】ENet:A Deep Neural Network Architecture for Real-Time Semantic Segmentation
本文作者分别来自波兰华沙大学和美国普渡大学。首发于arXiv.org,后于2017年发表于2017ICLR.论文地址:ENet:A Deep Neural Network Architecture for Real-Time Semantic Segmentation背景近年深度神经网络在计算机视觉领域发展迅猛,特别是图像分类等领域。但是大多数神经网络仍受限于计算量、存储空间、运算速...原创 2019-05-27 12:51:53 · 986 阅读 · 0 评论 -
【图像分割论文阅读】Learning Deconvolution Network for Semantic Segmentation
论文发表时间比较长,于2015年发表于ICCV,International conference on computer vision。一作是韩国人,就读于韩国浦项工科大学计算机科学与工程系。论文地址:Learning Deconvolution Network for Semantic Segmentation1.Introduction卷积神经网络在各类视觉识别类任务如图像分类、目...原创 2019-05-13 10:58:36 · 407 阅读 · 0 评论 -
【深度学习论文阅读】AlexNet:ILSVRC-2012冠军
卷积神经网络和人工神经网络的差别在于,卷积神经网络的输入为n*m*3的RGB图像,而人工神经网络的输入是n*1的矢量。滤波器必须具有与输入图像相同的数量的通道网络越深,使用的滤波器就越多;拥有的滤波器越多,获得的边缘和特征检测就越多;池化层:在卷积神经网络上减小特征空间维度,但不减少深度。...原创 2019-04-02 23:14:30 · 1858 阅读 · 0 评论 -
【深度学习论文阅读】NIN,Nework in Network ,2013
先放一张NIN的网络结构图问题提出传统卷积神经网络高层特征可以视作底层特征的某种组合,当需要提取潜在的高度非线性特征时,如果使用庞大的卷积层,弊端太明显。AlexNet中最后两层的全连接参数占整个网络的90%。传统CNN利用低层的卷积来提取特征,最后一个卷积层输出的feature map被向量化然后送入到全连接层,其后面跟着一个softmax logistic regression层...原创 2019-04-11 13:32:50 · 365 阅读 · 0 评论 -
【深度学习】ILSVRC图像分类竞赛----卷积神经网络CNN的发展
提起卷积神经网络,我们总会从LeNet5开始说起,但是LeNet5不是起点也不是终点。下面介绍CNN发展过程中的经典文章。1980年推出的neocognitron是第一个真正意义上的级联卷积神经网络,不过它并不完全是现在的卷积的形式。1989年Hinton用于处理声音信号的卷积网络TDNN。1989年,Yann LeCun和Y. Bengio等人开始认真研究卷积神经网络,此后的十年间,...转载 2019-04-02 23:12:59 · 3085 阅读 · 0 评论 -
目标检测Object detection
模型名年份作者论文名链接被引量R-CNN2013Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra MalikRich feature hierarchies for accurate object detection and semantic segmentationhttps://arxiv.org/a...原创 2019-04-02 23:56:57 · 237 阅读 · 0 评论 -
【深度学习论文阅读】计算机视觉论文汇总
名称年份作者文章名链接被引dropout2012Geoffrey E. Hinton, Nitish Srivastava, Alex Krizhevsky, Ilya Sutskever, Ruslan R. SalakhutdinovImproving neural networks by preventing co-adaptation of feature...原创 2019-04-04 15:07:21 · 1739 阅读 · 1 评论 -
【深度学习论文阅读】ILSVRC-2016:ResNeXt
参考文献:1.[ResNet系] 003 ResNeXt2.ResNeXt算法详解原创 2019-04-13 10:18:29 · 300 阅读 · 0 评论 -
【深度学习论文阅读】Object Detection经典论文-效果对比
目前看的论文其检测效果对比DetectorVOC2007VOC2009COCOPunishedR-CNN58.5--CVPR2014SPP59.2--ECCV2014FAST R-CNN70.068.419.7ICCV2015FASTER R-CNN73.270.421.9NIPS2015YOLO V166.4...原创 2019-04-17 09:15:10 · 403 阅读 · 0 评论 -
【深度学习论文阅读】计算机视觉领域数据集
1.MNISTMNIST是一个手写数字数据集(灰度图像),发布于1998年。来自美国国家标准与技术研究所(National Institute of Standards and Technology)。样本包含50%的高中学生,50%是人口普查局的工作人员。图片内容为0-9的数字,图片大小为28*28pixel。其中训练数据包含6w个样本,测试集数据包含1w个样本。缺点:灰度图像类别少,...原创 2019-04-17 14:22:55 · 398 阅读 · 0 评论 -
卷积、反卷积、空洞卷积动图
参考文章:1.卷积、反卷积、空洞卷积动图原创 2019-05-02 14:35:55 · 904 阅读 · 0 评论 -
【深度学习论文阅读】图像分类论文--效果对比
ConVetImageNet TOP-5 accpublished inAlexNet––VGG93.2ICLR2015GoogLeNet93.33CVPR2015ResNet96.43CVPR2015ResNeXt96.97CVPR2017SeNet97.749CVPR2018原创 2019-04-19 08:25:35 · 1732 阅读 · 0 评论 -
【深度学习论文阅读】TCN:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence
2018年人工智能十佳论文之一:TCN论文地址:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling项目地址:TCN的github链接ABSTRACT对于大多数 深度学习研究者而言,序列建模任务等价于RNN。但是最近的研究表明,在音频合成以及机器翻译等任务...原创 2019-05-03 17:01:16 · 10381 阅读 · 5 评论 -
【深度学习】卷积、反卷积以及dilated convolution
1. 卷积卷积(Convolutional):卷积在图像处理领域被广泛的应用,像滤波、边缘检测、图片锐化等,都是通过不同的卷积核来实现的。在卷积神经网络中通过卷积操作可以提取图片中的特征,低层的卷积层可以提取到图片的一些边缘、线条、角等特征,高层的卷积能够从低层的卷积层中学到更复杂的特征,从而实现到图片的分类和识别。2. 反卷积反卷积:反卷积也被称为转置卷积,反卷积其实就是卷积的逆过程。大...原创 2019-05-04 11:28:27 · 2403 阅读 · 0 评论 -
【深度学习】卷积神经网络为什么具有平移不变性?
什么是平移不变性?不变性不变性意味着即使目标的外观发生了某种变化,但是你依然可以把它识别出来。这对图像分类来说是一种很好的特性,因为我们希望图像中目标无论是被平移,被旋转,还是被缩放,甚至是不同的光照条件、视角,都可以被成功地识别出来。所以上面的描述就对应着各种不变性:平移不变性:Translation Invariance旋转/视角不变性:Ratation/Viewpoint Inv...转载 2019-05-09 15:34:16 · 6532 阅读 · 2 评论 -
【图像分割论文阅读】Maskab: Instance Segmentation by Refining Object Detection with Semantic
MaskLab2018年发表于CVPR,这是一篇关于实例分割的文章。论文地址:MaskLab: Instance Segmentation by Refining Object Detection with Semantic and Direction Features作者Liang-Chieh Chen(陈良杰),台湾人。加州大学洛杉矶分校的在读博士(不知道毕业了没),当时作者在谷歌工作。...原创 2019-06-11 22:12:34 · 1359 阅读 · 0 评论 -
【图像分割模型coding】Keras 利用Unet进行多类分割
1.前言unet论文地址unet,刚开始被用于医学图像分割。但当时的训练集是黑白图像并且只涉及到二分类问题。此前一直有尝试使用unet处理rgb三彩色图像进行多类分割问题,摸索之后,终有所获。【CPU实现】2.代码实现所采用的数据集是CamVid,图片尺寸均为360*480,训练集367张,校准集101张,测试集233张,共计701张图片。所采用的深度学习框架是tensorflow+ker...原创 2019-07-26 16:30:44 · 17951 阅读 · 291 评论