MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
大名鼎鼎的MobileNet,实习的时候发现工业界用的很多!今天要一探究竟了~
Depthwise Conv
本文首先对传统的卷积进行了改进(我一开始学的时候也觉得conv filter能不能换一种形式,然而两年过来了也没深入思考过了。惯性思维,相信权威……)
不再是conv filter通道数匹配feature的通道数,filter个数决定这一层feature通道数。
而是传统的conv被拆成了两步进行:
第一步,每一个filter(只有一个通道)对应输出一个feature的channel(也不用求和了),所以输出channel=M的feature,再用一个1x1conv把它变成N通道的feature
以实现和传统conv相同的目的
同样是MobileNets的架构,使用可分离卷积,精度值下降1%,而参数仅为1/7,厉害啊!
Structure
结构这张表很清晰了:
其他细节
摘要这段话挺有意思:
这两个参数在3.3 & 3.4节阐述了,不过我可能暂时用不到