轻量级网络之mobilenet_v1详解

最新推荐文章于 2025-02-24 16:06:06 发布

excelNo1

最新推荐文章于 2025-02-24 16:06:06 发布

阅读量7.8k

点赞数 2

文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/excelNo1/article/details/124273633

版权

本文详细解析了MobileNet V1的发展背景，如何通过深度可分离卷积实现轻量化，以及其网络结构、模块介绍。学习了宽度因子和分辨率因子对模型大小的影响。核心内容包括计算量优化与网络参数控制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

轻量级网络之mobilenet_v1详解

前言：学习网络结构有一段时间了，记录下mobilenet_v1的结构
论文地址：https://arxiv.org/pdf/1704.04861.pdf

一、mobilenet_v1 研究背景

1.随着Alexnet 获得2012年的 ILSVRC 2012的挑战冠军，通常的趋势是通过搭建更深的和更复杂的网络来获得更高的准确率。这些进步虽然可以提高精度，但在推理速度和模型大小却不一定是高效的。
2.考虑在有限算力的平台上需要实时获得识别任务，提出在移动端或者嵌入式中的轻量级神经网络。

二、如何实现轻量级神经网络

1.将标准的卷积核改成深度可分离卷积。

1.1 标准卷积（以3*3 为例子）
在这里插入图片描述

标准卷积计算量 = H * W * Dk * Dk * M * N

1.2 深度可分离卷积对比
在这里插入图片描述
参数计算量：包括深度卷积和逐点卷积
其中深度卷积计算量 = H * W * Dk * Dk * M
逐点卷积计算量 = M * N * 1 * 1 * H * W

1.3 标准卷积与深度可分离卷积计算量之比

倍率 = (H * W * Dk * Dk * M + M * N * 1 * 1 * H * W ) / (H * W * Dk * Dk * M * N ）
= 1/N +1/( Dk * Dk)

1.4结论
深度可分离卷积的计算量是标准卷积的 1/N +1/( Dk * Dk)倍。通常情况下，N (输出通道）远大于卷积核尺寸，故1/N +1/( Dk * Dk) 近似等于 1/( Dk * Dk)。当卷积核的大小为Dk =3 时，深度可分离卷积的计算量约为标准卷积的1/9倍。
在这里插入图片描述

2.提供宽度因子和图像分辨率因子来控制模型的大小及输入图片的大小。

2.1宽度因子
在有些应用场景中，可能需要更小的模型。因此引入了一个称为宽度因子的非常简单的参数α。宽度因子α的作用是在每层均匀地缩小网络。对于给定的层并且宽度乘法器α，那么输入通道M的数量变为αm，输出通道n的数量变为αn。α的取值范围通常为（0，1]，当然大于1也可以。在速度、大小和精度上做权衡。
在这里插入图片描述