图像分割
文章平均质量分 60
cv_family_z
这个作者很懒,什么都没留下…
展开
-
图像分割“The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation”
code:: https://github.com/SimJeg/FC-DenseNet DSOD中的一篇参考文献,不需要预训练进行图像分割,同样使用了DenseNet。在CamVid和Gatech数据库上,没有预训练,没有CRF后处理,达到了state-of-the-art的效果。DenseNet的优点:(1)参数有效性,参数使用效率高;(2)隐式深层监督,short paths;(3)特征重用原创 2017-08-23 15:24:54 · 6736 阅读 · 0 评论 -
图像分割“Understanding Convolution for Semantic Segmentation”
预训练的模型:https://goo.gl/DQMeun在图像分割编码网络和解码网络,分别使用了两种方法改进,提升分割效果。在解码阶段,使用致密的上采样卷积(DUC)生成像素级预测,DUC可以捕获双线性插值上采用损失的信息。在编码阶段,使用混合膨胀卷积(HDC)代替标准的膨胀卷积,解决“gridding”问题。致密的上采样卷积 目的是生成与输入图像大小相同的分割标记图,论文设计的带有DUC层的R原创 2017-08-21 16:39:00 · 1699 阅读 · 0 评论 -
图像分割“Efficient Deep Models for Monocular Road Segmentation”
快速图像分割,在KITTI数据库上做路面的分割,原始分辨率分割可以达到50ms。主要的改动是反卷积层中参数分布的改动。路面分割是个二分类问题:路面和非路面。使用模型f(x,γ)f(x,\gamma)表示网络结构,γ\gamma是网络参数,通过最小化误差得到: 网络结构 FCN一般有一个浓缩部分,还有一个对应的反卷积部分。论文提出的改进模型如下图所示: 浓缩网络层使用VGG分类网络初始化,每个膨原创 2017-08-14 15:29:36 · 979 阅读 · 0 评论 -
图像分割"LIP: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing"
数据集:http://hcp.sysu.edu.cn/lip code: https://github.com/Engineering-Course/LIP_SSL. 做人体部件分割,构建了一个新的数据库“LIP”,包含19个语义标记。在训练中融入结构信息,提升分割效果。 人体分割具体应用:行人再认证,行为分析等。 目前三个人体部件数据库ATR,Pascal-Person-Part和LIP复原创 2017-07-28 14:59:43 · 4086 阅读 · 0 评论 -
图像分割“LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation”
LinkNet主要特点是速度快,在嵌入式系统TX1和TitanX上运行速度都比较块。 LinkNet网络结构如图1所示: conv代表卷积,full-conv代表全卷积,卷积层之前加BN,后加ReLU,左半部分表示编码,右半部份标识解码,编码块包含残差块,LinkNet使用ResNet-18作为编码器,如下图所示: 解码块的细节如下图所示: LinkNet的创新点是将每个编码器与解码器相连接原创 2017-07-25 11:15:09 · 5391 阅读 · 0 评论 -
图像分割“RefineNet-Multi-Path Refinement Networks for High-Resolution Semantic Segmentation”
CNN用于语义分割,主要问题是重复的下采样操作带来的分辨率的下降。RefineNet提出了一个多路径的改进网络,提取下采样过程中所有信息,使用长距离残差连接获得高分辨率的预测。用精细层的特征 ,高层的语义信息可以得到改善。另外,论文使用了链式残差池化,可以获取丰富的背景知识。高层语义特征对获取图像区域的类别标识有帮助,而低层特征对获取边缘、突变有帮助,如何获取中间层的特征还是个开放性问题。论文设计原创 2017-07-24 16:34:38 · 2956 阅读 · 0 评论 -
图像分割“Fully Convolutional Instance-aware Semantic Segmentation”
相关方法 FCN用于语义分割的流程,输入任意尺寸的图像,经过一系列的卷积层,输出每个像素所有语义类别的似然得分,如下图所示: 但FCN不是instance-aware的,instance-aware需要检测和分割目标。卷积是平移不变的,同一个像素的响应相同,与上下文位置无关。instance-aware的语义分割是在区域级上操作的,统一像素在不同的区域有不同的语义,如图2所示: 主流的inst原创 2017-05-24 11:42:11 · 2944 阅读 · 2 评论 -
图像分割“Mask R-CNN”
在faster-rcnn网络上增加了一条与bbox回归和分类平行的结构,检测目标的同时输出目标的分割掩码图,运行效率为5fps,网络结构如下图所示: 掩码分支是一个用于每个RoI的小fcn网络,以pixel-to-pixel的方式预测分割掩码。Faster-RCNN不是设计来pixel-to-pixel的对齐,在特征提取过程中,RoIPool提供的是粗糙空间量化信息。Mask R-CNN提出了Ro原创 2017-03-28 17:03:46 · 6978 阅读 · 0 评论 -
图像分割"ScribbleSup: Scribble-Supervised Convolutional Networks for Semantic Segmentation"
像素级掩码标记非常耗时且繁琐,简单对每类语义划一条线作为标记,使用简笔标记的结果训练卷积网络进行语义分割,将降低标记人员工作量。基于图模型将简笔标记的信息,结合空间约束、外观及语义内容,传播到未标记的像素上。在PASCAL VOC上的简笔标记数据: http://research.microsoft.com/en-us/um/people/jifdai/downloads/scribble_sup原创 2017-06-15 15:21:20 · 4322 阅读 · 2 评论 -
图像分割“SegNet”
可训练的图像分割引擎,包含一个encoder网络,一个对应的decoder网络,衔接像素级分类层,解码网络与VGG16的13层卷积层相同。解码网络是将低分辨率的编码特征图映射到全分辨率的特征图。解码网络使用最大池化层的池化索引进行非线性上采样,上采样过程就不需要学习。上采样得到的稀疏图与可训练的滤波器卷积得到致密的特征图。使用池化层索引进行上采样的优势:1)提升边缘刻画度;2)减少训练的参数;3)这原创 2017-06-07 10:38:55 · 10882 阅读 · 0 评论 -
图像分割“Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade”
提出层级联(LC)提升语义分割的准确率和速度,将深度模型改为几个子模型的级联,初级子模型处理容易或置信度较高的区域,之后将较难的区域前向传播到下一级自模型处理。卷积仅在特定区域上计算,降低了计算量。优点: 1. 浅层处理较易区域,深层处理较难区域,自适应学习提升性能; 2. LC的训练和测试时间都有提升; 3. 端到端的训练结构,所有子模型联合训练。与V&J级联思路不同,层级联拒绝置信度较原创 2017-05-22 11:40:24 · 2327 阅读 · 0 评论 -
图像分割“Instance-aware Semantic Segmentation via Multi-task Network Cascades”
模型包含三个网络:实例分辨,掩码计算,目标归类。三个网络形成级联的结构。运行时间上,使用VGG-16一张图片需360ms。在MS COCO 2015分割比赛中获取第一名。将instance-aware语义分割分成三个子任务:1.实例分辨,使用类别无关的bbox表示实例;2.掩码估计,估计每个实例的像素级掩码;3.目标分类,预测每个掩码级别实例的类别。论文提出的多任务学习时级联结构,下一阶段依靠上一阶原创 2017-04-18 16:18:06 · 3289 阅读 · 3 评论 -
图像分割 DeepLab v2
标题:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs 网站: http://liangchiehchen.com/projects/DeepLab.html.深度卷积网络用于语义分割的三个挑战:特征分辨率下降 主要由于重原创 2017-05-23 15:56:17 · 10952 阅读 · 0 评论 -
图像分割“Fully Convolutional Networks for Semantic Segmentation”
文章使用了全卷积的网络,接受任意大小的输入,生成对应大小的输出。将 AlexNet,VggNet,GoogleNet转换为全卷积网络,并定义了结合深层和浅层信息的结构用于分割。全卷积网络结构 卷积的输入和输出关系为: 对于AlexNet来说,全连接层维度固定,不包含空间信息,但全连接可以看作是与覆盖全区域的核的卷积,这样就会生成特征图,如下图所示。 网络输出尺寸是10*10的特征图,原创 2016-10-12 17:05:58 · 1219 阅读 · 0 评论