squeezenet论文阅读笔记

最新推荐文章于 2022-05-19 15:47:09 发布

moxi_baba

最新推荐文章于 2022-05-19 15:47:09 发布

阅读量195

点赞数

分类专栏：论文阅读文章标签： squeezenet

本文链接：https://blog.csdn.net/weixin_43111538/article/details/84888714

版权

论文阅读专栏收录该内容

3 篇文章 0 订阅

订阅专栏

主旨还是要CNN的参数变得更小，要做到精确度不丢失的同时减少参数量。

squeezenet的首要目的是采用现有模型并以有损方式u压缩。

之前也有人提过网络剪枝这一概念，即用零来替换小于某一个值的参数，使网络稀疏化。

squeezenet结构设计策略：
1.用11卷积代替33卷积，因为这样会减少九倍的参数量。
2.减少3*3卷积的输入通道数，这一部分使用squeeze layers来实现
3. 在网络中延迟下采样的时间, 以便卷积层具有较大的特征图。在卷积网络中, 每个卷积层输出一个特征图, 这些特征图的高度和宽度由以下内容控制: (1) 输入数据的大小 (如256x256 图像) 和 (2)在CNN 体系结构中缩减像素采样的层的选择。最常见的情况是, 下采样通过在某些卷积或池层中设置。如果前边在网络中有很大的步长, 那么大多数图特征入将有小的激活映射。反之, 如果网络中的前边的层都有1的步长, 并且超过1的步长集中在网络的后半部分 , 则网络中的许多层将具有大的激特征图。我们的直觉是, 在其他不变的情况下，大的特征图 (由延迟下采样产生) 可以导致更高的分类精度。的确, K.He和 h. Sun 将延迟下采样率应用到四种不同的 CNN 体系结构中, 在每种情况下, 延迟下采样都会导致分类精度变高 (He& Sun, 2015).【这里所说的下采样应该就是指池化】
4. 策略1和2是关于在尽可能保持模型准确度地情况下减少 CNN 的参数数量,。策略3是关于在有限的参数数量下最大化精度。接下来, 我们描述的Fire模块, 将使我们能够成功地使用战略 1, 2 和3。

定义Fire模块如下。一个Fire模块包括: 一个squeeze层 (只有1x1 卷积), 将其放入一个具有1x1 和3x3 卷积组合的expand层中（图1）。在Fire模块中随意使用1x1 过滤器是应用3.1节中的策略1。在一个Fire模块中有三个超参数: s1x1, e1x1和 e3x3。在Fire模块中, s1x1 是squeeze层 (所有 1x1) 中的过滤器数, e1x1是1x1 卷积在expand层的数量, e3x3 3x3卷积在expand层的数量,。当我们使用Fire模块时, 我们设置 s1x1 小于 (e1x1 e + 3x3 ), 因此, expand层有助于限制3x3卷积中输入通道的数量即3.1节中的策略 2。

moxi_baba

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
squeezenet论文阅读笔记

主旨还是要CNN的参数变得更小，要做到精确度不丢失的同时减少参数量。squeezenet的首要目的是采用现有模型并以有损方式u压缩。之前也有人提过网络剪枝这一概念，即用零来替换小于某一个值的参数，使网络稀疏化。squeezenet结构设计策略：1.用11卷积代替33卷积，因为这样会减少九倍的参数量。2.减少3*3卷积的输入通道数，这一部分使用squeeze layers来实现3. 在网...
复制链接

扫一扫