语义分割之SegNet个人总结

1. 网络结构

在这里插入图片描述
在这里插入图片描述

SegNet采用的是对称式的结构,同时引入了BN层(相比于FCN)。
encoder即pooling,decoder即upsample。

SegNet的核心在于其上采样的方法(decoder部分)。 FCN是利用双线性插值初始化的反卷积进行上采样。而SegNet则是在每次pooling时,都存下最大值的位置,在upsample时将input值直接赋给相应的位置,其他位置的值置零。

2. Decoder

decoder部分采用上述的方法是有原因的:
(1) 不仅是去掉了FCN反卷积时所增加的训练参数,并且FCN融合不同scale的feature map也更耗显存
(2) 同时也是因为经过不断的下采样(encoder),图像的边界细节会不断损失,然而对于分割来说,边界信息很重要。所以SegNet利用这种decoder来保存边界信息。
在这里插入图片描述
经过上采样后,得到的feature map比较稀疏(很多0),于是接上一个卷积层,得到密集的feature map。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值