引入:本次学习内容基本来自于Andrew G. Howard ,Menglong Zhu ,Bo Chen等编写的的《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》,以及部分讲解视频,本学习记录仅为个人学习收获,部分内容存在纰漏烦请各位大佬批评指正。
(一)摘要:介绍了MobileNets这一轻量级卷积神经网络架构,旨在实现在移动设备上高效进行计算机视觉任务。通过使用深度可分离卷积和超参数设置等技术,MobileNets能够在保持较高准确率的同时,显著减少计算量和模型大小,适用于移动设备的计算资源有限的情况。
(二)发表时间:2017
(三)关键词:轻量级,深度可分离卷积,宽度系数,分辨率系数
(四)学习收获:
MobileNet的提出背景:传统卷积神经网络内存需求大,参数多,对运算资源要求高,并且无法保证在移动设备和嵌入式设备上运行。
核心:DW卷积(与PW卷积配合使用)、两个超参数(一个控制输入输出通道数,一个控制输入图像大小的,人为设定)。
传统卷积中,卷积核的channel=输入特征矩阵的卷积channel,卷积核的个数=输出特征矩阵的channel。
DW卷积:卷积核channel=1,输入特征矩阵的channel=输出矩阵的channel=卷积核的个数。此处的卷积核因为只有一个,因此每次只单独负责一个输入特征矩阵。DW卷积后存在一个PW卷积,PW卷积与传统卷积形式类似,通过DW卷积与PW卷积的联合使用,可以大大降低参数量核计算量。
问题:训练后的DW卷积会废掉,存在卷积为0的情况(V2版本中会解决)。