图像语义分割论文
文章平均质量分 80
介绍一些图像语义分割的最新技术,跟踪图像语义分割的最新论文,学习图像语义分割的最新模型
明天去哪
博观而约取,厚积而薄发.每天坚持写代码
展开
-
[SGN]SGN: Sequential Grouping Networks for Instance Segmentation
Abstract香港中文大学ICCV 2017的文章 实例分割是一个结合了物体检测和语义分割的任务,物体遮挡和数量差异大的物体是实例分割中的主要困难。本文考虑到实例分割的困难性,提出将这个复杂的任务用一系列神经网络来解决,其中每个神经网络的左右都是将该程度下的语义信息进行聚集,从而使用简单的结构逐渐构造物体实例。其中,第一个网络在图片的水平和竖直方向生成断点,接着使用一种算法将点连接成先...原创 2018-03-14 20:52:43 · 2460 阅读 · 0 评论 -
[GCPNet]Scene Parsing with Global Context Embedding
Abstract加州大学美熹德分校发表在ICCV 2017上的工作. 本文利用全局信息进行场景解析。训练基于场景相似度的网络来产生一张图片的全局信息特征关系,然后利用该信息产生全局和空间的先验知识。最后将这些先验知识作为全局上下文线索结合到分割网络中。实验辨明这种做法可以较少与全局信息相悖的假正例,最后在MIT ADE20k和PASCAL Context上达到了不错的性能. 本文的主要贡献...原创 2018-03-14 23:10:41 · 849 阅读 · 0 评论 -
[FoveaNet]FoveaNet: Perspective-aware Urban Scene Parsing
Abstract清华大学和一些企业合作的文章,发表于ICCV 2017.文章主要目前,大多数的图片解析模型都将所有尺寸和位置的信息同等对待,而没有考虑汽车捕获的城市场景图片的几何属性. 因此,由于摄像头的透视投影,会导致存在不同的物体尺寸,并且不可避免地造成场景解析和识别错误.本方法在Cityscapes和Camvid上达到了SOTA. 本文的主要贡献:(1)提出透视评估网络来学...原创 2018-03-15 16:35:53 · 923 阅读 · 0 评论 -
[zoom-out]Feedforward semantic segmentation with zoom-out features
AbstractCVPR 2015的文章,作者来自芝加哥丰田技术学院。早期的方法大多基于随机场结构来获取结构信息,本文考虑不使用这些方法来解决分割问题. 本文的语义分割方法是基于超像素级别的,主要做法就是使用缩放结构来利用不同等级的空间特征对超像素的类别进行判定,从而达到分割的目的. Frameworklocal zoom 即所求超像素块proximal zoom 超...原创 2018-03-06 20:02:32 · 764 阅读 · 0 评论 -
Residual attention network for image classification
AbstractCVPR2017的文章,商汤、清华、港中文和北邮合作的文章。基本想法就是受现在的attention mechanism 和residual的激励,考虑把两者放在一起实现更好的效果。 本文的主要贡献是: 可堆叠的网络结构注意力残差学习Bottom-up top-down相结合,自底向上是特征提取,自顶向下是attentionFrameworkA...原创 2018-03-02 19:30:22 · 1660 阅读 · 0 评论 -
[ParseNet]ParseNet: Looking Wider to See Better
Abstract北卡罗纳大学教堂山分校的文章, ICLR 2016. 本文的 Movitation 是看到FCN并没有结合全局信息,所以没有利用潜在的scene-level的语义上下文特征,所以提出一种结合average feature的网络结构来提高分割性能,最终在SiftFlow和PASCAL-Context上达到了SOTA, 在PASCAL VOC 2012上接近SOTA(Deepla...原创 2018-03-02 22:25:36 · 3479 阅读 · 0 评论 -
[U-Net] U-Net: Convolutional Networks for Biomedical Image Segmentation
Abstract生物学会议ICMICCAI 2015相关的文章,主要是针对生物学影像进行分割。本论文考虑到医学影像往往比较少,而深度学习通常需要大量的图像。因此本文提出采用很强的数据增强提高数据的利用效率;提出U型网络模型——近似对称的Conv + Deconv.最终在三个生物学数据集上达到了当时最好的性能。Movitation当今生物影像分割的数据太少,现有的滑动窗口的做法消耗时...原创 2018-03-02 15:54:54 · 2571 阅读 · 0 评论 -
Deep networks with stochastic depth
AbstractECCV2016的文章,和DenseNet同样的作者,这篇文章早于DenseNet. 深的网络在现在表现出了十分强大的能力,但是也存在许多问题。主要是梯度消散、前向传播中信息的不断衰减、训练耗时长等问题。本文主要是提出随机深度,在训练时使用较浅的深度(随机在resnet的基础上bypass掉一些层),在测试时使用较深的深度,较少训练时间,提高训练性能,最终在四个数据集上都超过...原创 2018-02-07 19:36:41 · 2728 阅读 · 0 评论 -
Residual Networks Behave Like Ensembles of Relatively Shallow Networks
Abstract本文是NIPS2016的文章,作者来自Cornell大学. 本文主要是对residual networks进行解释。首先,使用解构的思想吧ResNet等价于一组不同长度的路径的集合;然后采用了lesion study的方式揭示了不同路径之间并没有强依赖,尽管它们是联合学习的;最后,通过实验验证了大多数路径是短的,主要是短路径在学习,长路径不贡献梯度.最终得出一个结论,ResN...原创 2018-02-06 21:01:44 · 448 阅读 · 0 评论 -
[IDW-CNN]Learning Object Interactions and Descriptions for Semantic Image Segmentation
IDW-CNNAbstractCVPR 2017的文章,中山,港中文,商汤和中科院深研院合作的文章,和DIS是相同的作者. 本文仍然是立足于说现有的图像详细标注太少,导致语义分割的性能的首选,所以采用一种若监督的方法来提升性能(这个motivation似乎可以是所有弱监督方法的mt).本文提出使用Image Descriptions in the Wild(IDW)数据集结合VOC2...原创 2018-02-05 23:42:09 · 454 阅读 · 0 评论 -
[SDN]Stacked Deconvolutional Network for Semantic Segmentation
Abstract暂时还放在arxiv上,没有出版.中科院自动化所模式匹配国重的文章. 在本文看来,语义分割存在的主要问题是分辨率的降低导致物体细节和小物体损失,现在的很多方法都是致力于如何更好提高分辨率.本文于是提出了Stackecd Deconvolutional Network(SDN) Module来使用逐一堆叠的结构来集成上下文信息,更好地回复局部信息。 Introduct...原创 2018-02-05 20:44:45 · 1192 阅读 · 1 评论 -
[DIS]Deep Dual Learning for Semantic Image Segmentation
AbstractICCV2017的文章,港中文,中山和商汤合作. 本文认为现在的语义分割的性能并没有完全被开发出来,原因是需要大量的pixel级别的标注。本文的目的就是提出dual image segmentation(DIS),半监督来提高分割效率。DIS的三个主要优点是: (1)利用tags来提高labelmap的结果 (2) 能够clean tags that have noises ...原创 2018-02-02 20:02:05 · 1013 阅读 · 0 评论 -
Learning Hierarchical Features for Scene Labeling
基本情况这是PAMI2013的一篇文章,作者是LeCun等人,所属领域是Image Segmentation.Abstract本文提出了一种多尺度CNN,并且结合超像素的最佳覆盖,实现语义分割。在Sift Flow(33类)和Barcelona DataSet (170类)打破记录,在Stanford Background Dataset(8类)接近记录。产生320 ×240图像标...原创 2018-01-31 23:46:49 · 890 阅读 · 0 评论 -
[SDS]Simultaneous Detection and Segmentation
Motivation作者认为,尽管检测和分割被分成两个任务,但是这些差异都是人为设定的。因此,这里应该存在一种任务——Simultaneous Detection and Segmentation,这个其实就是后来的instance segmentation. 本文的目标就是提高SDS task的性能. Framework * proposal generation 由于是分...原创 2018-02-01 21:10:47 · 2564 阅读 · 0 评论 -
[NetWrap]Semantic Video CNNs through Representation Warping
ICCV2017的文章,arXiv:1708.03088 [cs.CV],德国的几个研究院所与NVIDA合作的文章. Abstract提出了一种方法将用于静态图片语义分割的CNN架构转化为能够用于视频图像进行语义分割的CNN架构. 主要采用的思想使用增强现有的架构,具体使用方法是添加NetWrap模块,借助的主要信息是optical flow的计算和整合. 最终达到在CamVid...原创 2017-10-28 15:07:34 · 2292 阅读 · 1 评论 -
[论文笔记]Predicting Deeper into the Future of Semantic Segmentation
引介ICCV2017的文章,arXiv:1703.07684 [cs.CV],本文有LeCun的署名.Abstract预测接下来视频帧的单纯的RGB像素值已经被研究了很久,本文提出了一种新奇的任务——预测接下来的视频帧的语义分割. 同时,本文提出了一种自动回归CNN(AR-CNN)来进行迭代生成多帧.Model数据采用Cityscapes数据集,分辨率转化为1...原创 2017-10-27 13:18:10 · 1231 阅读 · 0 评论 -
[论文翻译]A review on image segmentation techniques
引介1993年Pattern Recognition的文章.Abstract许多图像分割技术在文献中是可用的。这些技术中的一些仅使用灰度级直方图,有些使用空间细节,而其他技术则使用模糊集理论方法。大多数这些技术不适合嘈杂的环境。使用对噪声具有鲁棒性的马尔科夫随机场(MRF)模型进行了一些工作,但是引入了额外计算。由于并行处理能力,有助于实时获取输出的神经网络架构也被用于分割,即使在...翻译 2017-08-29 10:12:50 · 2020 阅读 · 0 评论 -
[DeCAF]DeCAF: A Deep Convolutional Activation Featurefor Generic Visual Recognition
基本情况ICML 2014的文章, arXiv:1310.1531 [cs.CV].主要通过实验证明transfer learning的可行性. Abstract本文评估从大型固定的一组对象识别任务中以完全监督的方式训练的深卷积网络的激活提取的特征是否可以重新利用到新的通用任务.在很多情况下,由于没有足够的标注或者未标注的数据来常规地训练一个深度结构用于新的任务(这会导致过拟合),因此本文尝试把提原创 2017-08-15 15:53:28 · 1480 阅读 · 0 评论 -
CCF计算机视觉会议及期刊排名
计算机视觉会议A类ICCV: International Conference on Computer VisionCVPR: International Conference on Computer Vision and Pattern RecognitionB类ECCV: European Conference on Computer VisionC类ACCV: Asian Conf原创 2017-06-25 12:00:14 · 9428 阅读 · 0 评论 -
【Caffe】Caffe: Convolutional architecture for fast feature embedding
推荐资料强烈推荐这篇文章:贾扬清:希望Caffe成为深度学习领域的Hadoop http://www.csdn.net/article/2015-07-07/2825150 .贾扬清阐述了caffe的诞生过程,从中可以看出他的成才之路,一个做什么都思路非常清晰的人. 推荐这篇文章:Caffe 作者贾扬清:我为什么离开 Google,加入 Facebook.caffe的在线分类Demo: h原创 2017-05-17 12:02:32 · 2852 阅读 · 1 评论 -
【PSPNet】Pyramid Scene Parsing Network
引介CVPR 2017,所属领域为Semantic Segmentation.Abstract场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的.本文使用文中的pyramid pooling module实现基于不同区域的上下文集成,提出了PSPNet,实现利用上下文信息的能力进行场景解析.Motivation作者认为,FCN存在的主要问题是没有采取合适的策略来用...原创 2017-05-15 11:06:20 · 3723 阅读 · 0 评论 -
【inv2】Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
基本情况这是一篇cv.LG2015的文章,所属领域为computer vision. Abstract在训练由于前面层的参数的变化,会导致本层输入分布的变化,因此导致训练一个DNN十分复杂,我们不得不降低训练速度和小心的初始化.这种现象被成为internal covariate shift. 解决上述问题,通常采用的方法是normalize输入层.我们的方法力图使规范化成为模型...原创 2017-05-14 13:12:32 · 866 阅读 · 0 评论 -
【TuSimple】understanding convolution for semantic segmentation
引介文章提出的网络在PASCAL VOC2012和Cityscapes上都叫TuSimple,TuSimple是指图森公司. 不过文章读起来也确实挺容易理解的. 这篇文章是2017年2月的文章,所属领域为Semantic Segmentation. Abstract本文展示了如何通过操纵更适合实际使用的卷积相关操作来改进像素级语义分割.首先,本文实现了dense upsampl...原创 2017-05-09 22:33:24 · 3594 阅读 · 0 评论 -
【CNNCRF】Efficient Piecewise Training of Deep Structured Models for Semantic Segmentation
基本情况本文是CVPR 2016的文章,领域是Semantic Segmentation. Abstract本文展示使用上下文信息提高语义分割.特别的,本文使用图片区域的’patch-patch’的上下文和’patch-background’的上下文.在从patch-patch的学习过程中,本文使用基于CNN的成对势能函数的CRFs来捕获相邻块中的语义相关性.利用本文提出的深度结...原创 2017-05-05 18:34:38 · 1504 阅读 · 0 评论 -
【squeeze】AlexNet-level accuracy with 50x fewer parameters
基本情况这篇是ICLR 2017(2016年上传到arxiv)的文章.主要针对模型压缩的.使用的是分类网络中的AlenNet为代表. Abstract目前很多方法都是只关注精度的,但是在同等精度的情况下,小的模型很多优点,比如:(1)训练等更快(2)在部署时更少的带宽要求,例如自动驾驶汽车(3)可以部署到FPGA等.正是由于有这些优点,本文提出了一种小的CNN架构,Squeeze...原创 2017-05-08 11:49:44 · 1370 阅读 · 0 评论 -
【CRFASRNN】Conditional Random Fields as Recurrent Neural Networks.md
基本信息这是2015年ICCV的一篇文章,所属领域为semantic segmentation.Abstact近些年有方法都尝试利用dnn的能力实现semantic segmentation任务.但是,这种方法的一个核心问题是深度学习技术描绘视觉对象的能力有限. 为了解决上述问题,本文提出了一种新的形式的CNN,它结合了CNNs和CRFs.我们的方法把CRF集成到CNNs中,实现...原创 2017-05-04 22:56:51 · 3979 阅读 · 0 评论 -
【DeconvNet】Learning Deconvolution Network for Semantic Segmentation
基本情况这是ICCV2015的一篇文章,所属领域为semantic segmentation.这篇文章比SegNet早.Abstract提出深度反卷积网络: 是在vgg16的顶部添加反卷积层.反卷积层由deconvolution、relu和upooling组成. 通过把每一张图片的不同的proposal送入deploy的网络,通过aggregate得到最后的语义分割结果. 改进...原创 2017-05-03 14:40:26 · 3554 阅读 · 3 评论 -
【Review】A Review on Deep Learning Techniques Applied to Semantic Segmentation
基本情况2017年4月份的文章.深度学习技术在语义分割中的应用综述,能写综述性质文章的都是大神,并且本文可以说是深度学习进行语义分割的第一本综述.本文正文有20页,参考文献有114篇,含28个数据集和27种方法. Abstract综述性质的文章,本文首先描述了这个领域的一些专业术语和基本概念;接下来,介绍了主要的数据集和竞赛;然后回顾了存在的方法,强调了这些方法的主要贡献;最后,...原创 2017-05-02 20:16:03 · 3815 阅读 · 2 评论 -
【ICNet】ICNet for Real-Time Semantic Segmentation on High-Resolution Images
基本情况2017年4月份的文章,所属领域是Semantic Segmentation.Abstract本文主要是针对realtime semantic segmentation问题.本文提出的方法减少了大量的计算,这个方法是基于PSPNet压缩的图片级联网络(ICNet),在合理的标签指导下结合多个分支来实现较少计算的目的.接着,本文又深度分析了本框架,并引入cascade fea...原创 2017-05-01 11:16:44 · 7616 阅读 · 2 评论 -
mAP在计算机视觉中的应用
要谈mAP必须先说一下,精准率(Precision, P值)和召回率(Recall,R值).P值和R值最初是信息检索领域的评价指标. 准确率Accuracy这个概念是指分类的准确率,也就是分类准确的样本与样本总数之比. 举个例子:假设一个样本集中有100个样本,其中99个负样本,1个正样本.碰巧某个分类器的原理就是所有样本均判为负,那个这个分类器的accuracy就是原创 2017-04-21 09:49:42 · 5591 阅读 · 0 评论 -
【fcCRFs】Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials
基本情况这篇文章是NIPS2011和CVPR2012的文章,所属领域为segmentation. Abstract目前,大部分state-of-the-art的多类别图像分割算法都使用基于像素或者区域的CRFs.虽然区域级别模型通常具有密集的成对连接性,但像素级模型相当大,只允许使用稀疏图形结构. 本文的主要贡献是对于fc CRFs的高效近似推理算法,其中pairwise edge potent原创 2017-04-22 13:12:13 · 3209 阅读 · 0 评论 -
【SegNet】SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image
基本情况这是2015CVPR的一篇文章,所属领域为semantic segmentation. Abstract提出了SegNet,核心的训练引擎包含一个encode网络,接上一个decoder网络,并跟随一个用于pixel-wise分类层. 通过比较SegNet和FCN的相关方法,揭露在segmentation时内存和准确度的对应. 利用SegNet做了在Camvid和SU...原创 2017-04-23 21:06:33 · 1730 阅读 · 0 评论 -
【deeplab】Semantic Image Segmentation with Deep Convolutional Nets and Fully
deeplab有两篇论文,由于第二篇是在第一篇上增加了一部分内容,就放在一起进行学习了. 第一篇Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFS 基本信息这篇是ICLR2015上的一篇文章,所属领域为semantic segmentation. A...原创 2017-04-24 22:59:19 · 5175 阅读 · 0 评论 -
【论文翻译】SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation
Segnet: 一种用于图像分割的深度卷积编码-解码架构摘要我们展示了一种新奇的有实践意义的深度全卷积神经网络结构,用于逐个像素的语义分割,并命名为SegNet.核心的可训练的分割引擎包含一个编码网络,和一个对应的解码网络,并跟随着一个像素级别的分类层.编码器网络的架构在拓扑上与VGG16网络中的13个卷积层相同.解码网络的角色是映射低分辨率的编码后的特征图到输入分辨率的特征图.具体地...翻译 2017-04-25 16:07:38 · 31705 阅读 · 24 评论 -
【PASCALVOC】The Pascal Visual Object Classes Challenge: A Retrospective
基本情况这篇文章PASCALVOC官方发表在IJCV2015上的一篇文章,主要是对之前的2008-2012challenge的回顾. AbstractPASCAL VOC(pattern analysis,statistical modelling and computational learning visual object classes)主要包含两个主要部分:(1)...原创 2017-04-19 23:31:36 · 5188 阅读 · 0 评论