Attention to Scale: Scale-Aware Semantic Image Segmentation论文阅读笔记

本篇论文主要介绍了尺度感知的语义图像分割(scale-aware Semantic Image Segmentation)


1.首先,多尺度的特征是提升语义图像分割性能的一个关键因素。
2.提取多尺度的特征主要有两种网络结构:
  第一种是:skip-net,第二种是:share-net
  
(1)skip-net的特点是取网络中多个中间层的特征并合并成一个特征,以实现多尺度的特征;
(2)share-net的特点是对输入图像进行尺度上的变换,得到不同尺度的输入图像,然后分别输入给网络,这样能够得到不同尺度的输入图像的特征,以形成多尺度的特征。
3.论文采用的是share-net的方式来得到多尺度的特征,在采用share-net方式提取多尺度特征时,需要考虑到一个问题,就是如何对多个尺度输入图像得到的特征进行融合?
(1)多尺度输入图像的特征的融合目前主要有两种方式,一种是max pooling;一种是average pooling(取平均);

(2)本篇论文提出对多尺度输入图像特征进行加权求和进行融合:


   是不同的尺度

  用图来表示:

  
4.多尺度输入图像的特征采用加权进行融合,如何得到各个尺度的权值?论文提出了利用注意力模型(Attention model)来训练得到各个尺度的权重。


5.Attention Model的网络结构:
  
6.Attention Model的实现
  Attention Model是一个两层的卷积结构,第一层有卷积层有512个3*3的卷积核,第二个卷积层有S个1*1的卷积核(S是尺度数,也就是不同尺寸输入图片数)。 
   
7.对Attention Model如何进行训练这块没有理解。

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值