【深度学习】【CVPR2019】Auto-deeplab

最新推荐文章于 2024-04-20 09:40:34 发布

Hanawh

最新推荐文章于 2024-04-20 09:40:34 发布

阅读量258

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_36530992/article/details/103292939

版权

深度学习专栏收录该内容

43 篇文章 3 订阅

订阅专栏

【CVPR2019】Auto-deeplab

作者
简介
相关工作
Cell 搜索
Network 搜索
实验

Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

作者

在这里插入图片描述

简介

在这里插入图片描述

Cell 搜索

所谓cell是整个网络的基本结构，例如resnet中的residual block，一个cell是由多个block构成，一个cell中的一个block可以用如下式子表示：
$I_1,I_2,O_1,O_2,C)$
$I_1,I_2$ 是输入， $O_1,O_2$ 是输入对应的操作， $C$ 是逐元素相加操作，从而得出该block的输出，也就是将两个输入合并成一个输出。下图是所有可能的操作集合 $O$ ，该部分同darts相同。
在这里插入图片描述
对于每一个block，其输入集合 $I$ 是前面所有的block的输出，而一个cell的输出则是各个block输出的按通道拼接。如下图所示，图来自于darts论文，各个方块代表的是一个block的输出，而这个cell最终的输出，也就是方块3是方块0、1、2输出的拼接。
在这里插入图片描述

而在该论文中，一个cell是如下所示的，其中的 $^sH^{l-2}$ 、 $^sH^{l-1}$ 分别是上上一层、上一层的输出，剩下的 $^sH^{l}_i$ 是定义的hidden states，对于每一个hidden states，其输入集合 $I$ 是上上一层、上一层的输、和之前hidden states的输出，而该cell的输出就是这些hidden states的按通道拼接，所以输出大小不变，只有通道数增加了。
在这里插入图片描述
通过下式的连续化，即加入了 $\alpha$ ，详细内容可阅读darts，便可以通过梯度下降法来训练 $\alpha$ 参数，可以将 $\alpha$ 视为概率，在模型训练结束后，只要找到 $\alpha$ 最大的两个值，就找到了该block使用的是哪两个输入，从而可以得到该block的输出。
在这里插入图片描述

Network 搜索

对于分类任务有着相同的预设模式：normal cell维持特征图大小；reduction cell使特征图缩小一半并使通道数加倍；前者被后者等间隔分隔开。
然而对于语义分割任务有两类特征，不能仅仅靠这种预设模式来进行堆叠：
1. 下一层的输出是上一层输出的两倍、一半或者相等。
2. 最小的特征图是原图的1/32。
网络部分搜索空间如下图所示，该部分目的是在network level search找到一条走过L个点的路径，最初的两个白点代表的是固定的操作，即将特征图缩小两倍，其他的蓝点代表只能缩小两倍或放大两倍或维持不变(灰线)。不管这条路径最后得到多大的特征图，都会接上Atrous Spatial Pyramid Pooling(ASPP)使特征图回到原本的大小。

在该部分，也是加入了权重 $\beta$ 使离散的选择连续化，在训练完模型后，我们可以将 $\beta$ 视为转移概率，要找到从头到尾最大概率的路径，可以通过Viterbi algoritm达到， $S$ 代表的是下采样的尺度。

实验

在这里插入图片描述
将数据分为两部分，一部分训练网络内部权重 $w$ ，另一部分训练网络外部权重 $\alpha,\beta$ ，作者发现如果一开始就优化第二部模型表现很差，所以在10个epoch之后开始更新第二步。

Hanawh

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】【CVPR2019】Auto-deeplab

【CVPR2019】Auto-deeplabAuthors![在这里插入图片描述](https://img-blog.csdnimg.cn/20191128143405779.png#pic_center=300x)IntroductionRelated WorkCell SearchAuto-DeepLab: Hierarchical Neural Architecture Search fo...
复制链接

扫一扫