论文全称:
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
下载地址:
https://arxiv.org/pdf/1704.04861.pdf
论文核心思想:
本文对我们常见的卷积操作进行了改进,使得计算量得到了降低。
设:
输入图片F的大小是Df*Df*M,Df表示宽、高,M表示通道数。
stride为1,padding取使得输出图片的宽、高均等于输入图片的宽、高的值。
输出图片G的大小是Df*Df*N,Df表示宽、高,N表示通道数。
常规卷积:
常规卷积操作的示意图:
设常规卷积中,卷积核G的大小是Dk*Dk*M*N,Dk表示宽、高,M表示通道数,N表示卷积核个数。
则常规卷积的操作需要执行的计算量为:
乘法次数:Dk*Dk*M*N*Df*Df,加法次数:Dk*Dk*M*N*Df*Df-1
由于乘法更加耗时,所以重点考察乘法次数,则 Cost A= Dk*Dk*M*N*Df*Df
其中,Dk*Dk*M表示每个卷积核每滑动到一个位置需要执行的乘法的次数;Df*Df表示每个卷积核需要卷积的次数。