TensorFlow2语义分割算法 SegNet 论文解读

目录

摘要

1、引言

2、文献综述

3、网络结构

(1)解码器的改变

(2)训练

(3)分析

4、基准

(1)道路场景语义分割

(2)SUN RGB-D室内场景

5、讨论和今后的工作

6、结论


摘要

提出了一种新颖实用的用于语义像素分割的深度全卷积神经网络结构SegNet。其核心的分割网络由一个编码器网络、一个对应的解码网络和一个像素级分类层组成。编码器网络的结构在拓扑上与VGG16网络中的13个卷积层相同。解码器网络的作用是将低分辨率编码器的特征映射到全输入分辨率的特征图,以进行像素级分类。SegNet的新颖之处在于解码器对其低分辨率输入特征映射进行上采样的方式具体地说,解码器使用在对应编码器的最大池化步骤中计算的池索引来执行非线性上采样。这就消除了学习向上采样的需要。上采样的地图是稀疏的,然后用可训练的卷积层卷积得到稠密的特征地图。我们将我们提出的结构与广泛采用的FCN以及著名的DeepLab LargeFOV,DeconvNet结构进行了比较。这种比较揭示了实现良好分割性能所涉及的内存与精度的权衡。

SegNet的主要针对场景理解应用。因此,它在被设计时,兼具在推理过程中在内存和计算时间方面的有效性。SegNet的可训练的参数量比其它的网络结构显著减少,并且它可以通过随机梯度下降算法进行端对端地训练。在道路场景和 SUN RGB-D 室内场景分割任务中,我们还执行了SegNet和其他架构的受控基准测试。这些定量评估表明,与其他体系结构相比,SegNet在在推理过程中,具有时间和内存方面的良好性能。我们还提供了SegNet的Caffe实现和web演示,参见: http://mi.eng.cam.ac.uk/projects/segnet/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能_SYBH

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值