图像分割系列 <-> 语义分割

 点击上方码农的后花园”,选择星标” 公众号

  精选文章,第一时间送达

上期讲到图像分割(Image segmentation)根据某些规则把图片中的像素分为不同的部分(加不同的标签),它可分为:超像素、语义分割、实例分割、全景分割, 各有联系,又有区别。

这期我们就来讲讲语义分割(Semantic Segmantation), 语义分割是指将图像中的每一个像素都赋予一个类别标签,用不同的颜色表示。

一、语义分割的概念和基础

举例:在对于我们人来说,给出这一幅图,我们很容易知道图片中那部分是猫,那些部分是落叶,那计算机怎么是如何判别呢?

因为对于计算机来讲这幅图是一堆像素点组成,那么对于计算机来说,只要找到图片中那些像素点属于猫,那些像素点属于落叶,这就是语义分割做的事情。

对于这张图,语义分割要做的事情就是找到图片中那些像素点属于小朋友,那些像素点属于机车,右图就是进行语义分割之后的结果。

总的来说语义分割的工作就是对原图片中的每个像素点进行类别划分,在这里属于小朋友的像素点标绿色,机车的像素点标绿色,这就是两个不同的类。

二、语义分割SegNet的来源

Segnet模型由Vijat  Badrinarayanan, Alex Kendall, Roberto Cipolla在2015年发表, 在FCN的语义分割任务基础上,搭建编码器-解码器对称结构,实现端到端的像素级别图像分割。下图是 Segnet 网络架构,后面讲解。

Segnet的模型框架和思路比较简单,应用了当年很火的VGG16框架,去掉全连接层,搭建对称模型,在2014年当时还没有兴起框架,基于Caffe实现端到端的像素级别网络模型是很难的,之后在MATLAB2016中,Sgenet成为内置的用于语义分割的深度学习算法。

2016年,Segnet研究组在原有网络框架基础上加入了跳跃连接,有了进一步的发展,但是后来新奇了各种规模更大层次更深的深度网络(以Resnet为主要框架)把Segnet碾压。

下图是SegNet论文原文:https://arxiv.org/abs/1511.00561,文末可获取。

三、语义分割的模型架构

Segnet模型是一个比较基础的语义分割模型,在讲解其结构之前,我们先了解Convolutional Enconder-Decoder的结构,也就是卷积层编码与解码的过程,如下图所示:

卷积层的编码与解码就是图像的Encoder和Decoder过程,编码Encoder的过程就是对我们Input的图片不断进行特征提取,这个过程中图片的长和宽不断的进行压缩,通道也会变得越来越大,这就是卷积神经网络的特点。 解码Decoder的过程就是对Enconder最终提取到的特征层进行长和宽的不断的放大,放大到和原图差不多的尺寸,再对每一个像素点进行分类,最终我们得到每个像素点所属的类是什么, 分类一般是使用Softmax函数。(压缩-》放大-》分类)

四、语义分割系统发展的基础

下面几个是对对计算机视觉领域做出重大贡献的标准深层网络,用于图像的特征提取,也就是SegNet的编码部分。

Alexnet: Toronto首创的Deep CNN,以84.6%的测试准确率赢得了2012年Imagenet竞赛。它由5个卷积层、最大池层、作为非线性的ReLUs、3个完全卷积层和dropout组成。

VGG-16这款牛津型号以92.7%的准确率赢得了2013年的Imagenet竞争。它使用第一层中具有小接收场的卷积层堆栈,而不是具有大接收场的少数层。

GoogLeNet:这GoogLeNet赢得了2014年Imagenet的竞争,准确率为93.3%。它由22层和一个新引入的称为初始模块的构建块组成。该模块由网络层网络、池操作、大卷积层和小卷积层组成。

Resnet:这款微软的模型以96.4%的准确率赢得了2016年的Imagenet竞争。这是众所周知的,因为它的深度(152层)和残余块的引进。剩余的块通过引入标识跳过连接来解决培训真正深层架构的问题,以便层可以将其输入复制到下一层。

MobilNet: MobileNet的基本单元是深度级可分离卷积(depthwise separable convolution), 是CVPR-2017一篇paper,作者均来之Google, 采用新的卷积方式减少参数数量 并提升运算速度。

五、语义分割常用数据集和评估算法指标

1.目前有一些常用于训练语义分割模型的数据集:

  • Pascal VOC 2012 :   有 20 类目标,这些目标包括人类、机动车类以及其他类,可用于目标类别或背景的分割。

  • Cityscapes:  50 个城市的城市场景语义理解数据集。

  • Pascal Context:  有 400 多类的室内和室外场景。

  • Stanford Background Dataset:  至少有一个前景物体的一组户外场景

来自 Stanford Background Dataset 的示例图像,该数据集的图像大致为 320 *240 像素,还包括指向每块像素所属类别的整数矩阵。

2.用于评估语义分割算法性能的标准指标是平均 IOU(Interp Over Union-交并比)

IoU 定义如下:

这样的评价指标可以判断目标的捕获程度(使预测标签与标注尽可能重合),也可以判断模型的精确程度(使并集尽可能重合)

好啦,这期就到这里了,SegNet原文VOC2007和 2012 语义分割数据集,在后台回复:项目实战,即可获取,后期会出项目实战系列教程。

更多优质内容?等你点在看

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这段代码是一个网页的HTML代码,其中包含了一些标签和属性,具体注释如下: - `</head&gt;`:HTML文档的头部,通常用于引入CSS和JavaScript文件等。 - `<body&gt;`:HTML文档的主体,包含了网页的主要内容。 - `<div class="top"&gt;`:一个类名为"top"的`<div&gt;`元素,用于包裹顶部导航栏的内容。 - `<h1&gt;尚云AI平合</h1&gt;`:一个标题标签,显示文本"尚云AI平合"。 - `<ul&gt;`:一个无序列表标签,用于包裹导航栏的各个选项。 - `<li class="top-1"&gt;<a href=""&gt;首页</a&gt;</li&gt;`:一个列表项,包含了一个超链接,显示文本"首页",类名为"top-1"。 - `<li class="top-1 top-ji"&gt;<a href=""&gt;汁算机祝覚</a&gt;`:一个列表项,包含了一个超链接,显示文本"汁算机祝覚",类名为"top-1 top-ji"。 - `<div class="showone"&gt;`:一个类名为"showone"的`<div&gt;`元素,用于包裹下拉菜单的内容。 - `<ul class="showone-1" style="float: left;width: gopx; text-align: center;"&gt;`:一个类名为"showone-1"的无序列表标签,设置了浮动、宽度和文本对齐方式。 - `<li style="font-size: 15px;color:口#000;margin: 5px;"&gt;片处理</li&gt;`:一个列表项,设置了字体大小、颜色和外边距,显示文本"片处理"。 - `<li class="color"&gt;表情识别</li&gt;`:一个列表项,类名为"color",显示文本"表情识别"。 - `<li class="color"&gt;人脸识别</li&gt;`:一个列表项,类名为"color",显示文本"人脸识别"。 - `<li class="color y"&gt;<a href="/botany.html"&gt;植物決別く</a&gt;</li&gt;`:一个列表项,类名为"color y",包含了一个超链接,显示文本"植物決別く",链接到"/botany.html"。 - `<li&gt;国像分类く</li&gt;`:一个列表项,显示文本"国像分类く"。 - `<li&gt;语义分割</li&gt;`:一个列表项,显示文本"语义分割"。 - `<li&gt;风格迁移</li&gt;`:一个列表项,显示文本"风格迁移"。 - `<li&gt;像生成</li&gt;`:一个列表项,显示文本"像生成"。 - `<li&gt;目标检测</li&gt;`:一个列表项,显示文本"目标检测"。 - `<li&gt;姿态识别</li&gt;`:一个列表项,显示文本"姿态识别"。 - `</ul&gt;`:结束无序列表。 - `</div&gt;`:结束下拉菜单的`<div&gt;`元素。 - `</ul&gt;`:结束顶部导航栏的无序列表。 - `</div&gt;`:结束包裹顶部导航栏的`<div&gt;`元素。 - `</body&gt;`:HTML文档的主体结束标签。 - `</html&gt;`:HTML文档结束标签。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值