Attention to Scale: Scale-Aware Semantic Image Segmentation论文阅读笔记

最新推荐文章于 2021-03-02 10:42:25 发布

ScarecrowLiu

最新推荐文章于 2021-03-02 10:42:25 发布

阅读量4.5k

点赞数 3

分类专栏：深度学习(Deep Learning) 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ScarecrowLiu/article/details/52982686

版权

深度学习(Deep Learning) 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

本篇论文主要介绍了尺度感知的语义图像分割(scale-aware Semantic Image Segmentation)

1.首先，多尺度的特征是提升语义图像分割性能的一个关键因素。
2.提取多尺度的特征主要有两种网络结构：
第一种是：skip-net，第二种是：share-net

(1)skip-net的特点是取网络中多个中间层的特征并合并成一个特征，以实现多尺度的特征；
(2)share-net的特点是对输入图像进行尺度上的变换，得到不同尺度的输入图像，然后分别输入给网络，这样能够得到不同尺度的输入图像的特征，以形成多尺度的特征。
3.论文采用的是share-net的方式来得到多尺度的特征，在采用share-net方式提取多尺度特征时，需要考虑到一个问题，就是如何对多个尺度输入图像得到的特征进行融合？
(1)多尺度输入图像的特征的融合目前主要有两种方式，一种是max pooling；一种是average pooling(取平均)；

(2)本篇论文提出对多尺度输入图像特征进行加权求和进行融合:

是不同的尺度

用图来表示：

4.多尺度输入图像的特征采用加权进行融合，如何得到各个尺度的权值？论文提出了利用注意力模型(Attention model)来训练得到各个尺度的权重。

5.Attention Model的网络结构：

6.Attention Model的实现
Attention Model是一个两层的卷积结构，第一层有卷积层有512个3*3的卷积核，第二个卷积层有S个1*1的卷积核（S是尺度数，也就是不同尺寸输入图片数）。

7.对Attention Model如何进行训练这块没有理解。

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
3
评论
Attention to Scale: Scale-Aware Semantic Image Segmentation论文阅读笔记

本篇论文主要介绍了尺度感知的语义图像分割(scale-aware Semantic Image Segmentation)1.首先，多尺度的特征是提升语义图像分割性能的一个关键因素。2.提取多尺度的特征主要有两种网络结构：第一种是：skip-net，第二种是：share-net (1)skip-net的特点是取网络中多个中间层的特征并合并成一个特征，以实现多尺度的
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。