论文地址:Rethinking the Inception Architecture for Computer Vision
前言
俗话说得好,探索的道路是永无止境的,GoogLeNet经过了Inception V1、Inception V2(BN)的发展以后,Google的Szegedy等人又对其进行了更深层次的研究和拓展,在本文中,作者提出了当前环境下,网络设计的一些重要准则,并根据这些准则,对原有的GoogLeNet进行了改进,提出了一个更加复杂、性能更好的模型框架:Inception V3。这篇文章证明了这些改进的有效性,并为以后的网络设计提供了新的思路。
背景
自ILSVRC2014之后,GoogLeNet备受追捧,它具有非常好的性能,虽然它的网络拓扑比较复杂,但是由于其特殊的设计模式(见前两篇文章),它的参数量、内存与计算资源的消耗都比传统的网络、甚至是同期的VGG相比,都要小很多,因此GoogLeNet的适用性更强。但是GoogLeNet也存在它的缺陷,Inception的复杂性注定了网络的改变会很困难,随着网络结构的拓展,如果仅仅是简单的通过复制模块来对模型进行放大,模型计算上的优势将会消失,并且GoogLeNet原文中也并没有提出网络设计的原理和准则,因此很难在