深度学习：卷积神经网络之Inception网络

最新推荐文章于 2024-06-15 08:32:38 发布

ShadyPi

最新推荐文章于 2024-06-15 08:32:38 发布

阅读量2k

点赞数 1

分类专栏：深度学习与神经网络文章标签： Inception网络瓶颈层计算优化卷积神经网络深度学习

本文链接：https://blog.csdn.net/ShadyPi/article/details/122820672

版权

深度学习与神经网络专栏收录该内容

19 篇文章 1 订阅

订阅专栏

（因为找不到Inception的合适翻译，就保留原文吧……）

文章目录

动机
优化计算
搭建Inception网络

动机

Inception网络的原始动机可能是“我全都要”，因为在普通的CNN中每次我们要么用一堆同样大小的过滤器，或者加一个池化层，而Inception模块则是想要在一层的运算中集合这几种运算：
在这里插入图片描述
在上图中，分别使用 $1\times 1,3\times 3,5\times 5$ 的过滤器做等大卷积，之后用最大池化并填充，获得四个相同高和宽的矩阵，将它们的通道维度叠加在一起完成了运算。这就是最基本的Inception操作，它将多种过滤器以及池化合并在一起，输出一个信息更加多样的矩阵。其中运算的参数（包括过滤器的大小）都可以作为深度学习的内容。

优化计算

在一层中加入这么多操作，随之而来的就是计算量大大上升。对于32个 $5\times 5\times 192$ 的过滤器来说，输出矩阵中的每一个元素都要进行 $5\times 5\times 192$ 次乘法，而输出矩阵共有 $28\times 28\times 32$ 个元素，也就是说一共要进行 $5\times 5\times 192\times 28\times 28\times 32=120,422,400$ 即1.2亿次乘法，这还仅仅是一层运算中的一部分。所以为了减少计算量，我们在Inception模块中加入了“瓶颈层”来约束矩阵的大小。
在这里插入图片描述
瓶颈层事实上是一层 $1\times 1$ 的过滤器卷积，通过32个 $1\times 1\times 192$ 的过滤器将矩阵维度缩减到 $28\times 28\times 32$ ，这样再进行 $5\times 5$ 的过滤器卷积，就只消耗 $28\times 28\times 16\times 192+28\times 28\times 32\times 5\times 5\times 16=12,443,648$ 次运算，减少了约 $90\%$ 的计算量。
只要合理地实现瓶颈层，就可以既缩小输入矩阵的大小，又不影响整体性能。

搭建Inception网络

有了上面的基本操作，我们就可以先搭建一个Inception模块：
在这里插入图片描述
对于 $3\times 3$ 和 $5\times 5$ 的过滤器，我们都先加一个瓶颈层来优化计算。同时，因为填充池化后，通道数跟输入矩阵是一样的，为了减少一些通道数目，在池化过后接一个 $1\times 1$ 过滤器减少通道数。最后，将四条路经的输出通过通道连接组件组合在一起，构成一个完整的Inception模块。