语义分割模型LinkNet介绍

LinkNet是2017年CVPR上的一篇论文(论文地址:https://arxiv.org/abs/1707.03718)。由于网上的论文笔记以及讲解不是很清晰,因此决定下载论文自己阅读一下,若有理解错误的地方还请大家指正。

模型提出的背景

作者认为当时的模研究主要都是集中在提高模型的精度上,而忽略了模型的效率。在实时语义分割上的研究工作不多。作者提出的LinkNet在提高速度的同时又保证了精度。

网络结构

LinkNet模型结构
这里插入图片描述
ALT
在这里插入图片描述
网络的结构借鉴了U-Net的思想。采用了Encoder-Decoder结构,模型左边是Encoder,右边是Decoder。作者认为当时的语义分割算法大部分都以ResNet101,VGG16等作为Encoder,这样导致了非常大的参数量。所以作者选择采用ResNet18作为Encoder。作者认为它们提出的模型(LinkNet)的创新之处便是在Encoder与Decoder的连接方式上。通过Encoder的多次下采样后,一些空间信息损失了,而且在Decoder部分很难恢复这些损失的空间信息。像FCN那样通过池化索引(pooling indices)来连接Encoder与Decoder的缺点是这些池化索引时不可训练的(untrainable)。而有些方法则是直接将Encoder的输出输入到Decoder。在本文中作者不仅将Encoder的输出作为Deocder的输入,还将Encoder的输入作为送入到Decoder。

Fig.2中展示了每个Endcoder Block中采用的残差结构,TABLE 1 为Encoder Blocks的输入输出特征图数量。

Fig.3是每个Decoder块的详细结构。full-conv[(3,3),(m/4,m/4),*2)中(3,3)为卷积核大小,(m/4,m/4) 为输入特征图通道数与输出特征图通道数。*2代表上采样因子为2。

实验结果

在这里插入图片描述
在这里插入图片描述

结论

  1. 轻量化: 采用了Resnet18作为Encoder
  2. 实时分割,目的是运行在移动设备上
  3. 运行速度块

GitHub代码链接

pytroch版: https://github.com/e-lab/pytorch-linknet

  • 4
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值