轻量级网络 - PVANet & SuffleNet

最新推荐文章于 2024-08-18 10:43:44 发布

linolzhang

最新推荐文章于 2024-08-18 10:43:44 发布

阅读量8.3k

点赞数 4

分类专栏：深度学习深度学习进阶文章标签：深度学习 PVANET MobileNet ShuffleNet 轻量级网络

本文链接：https://blog.csdn.net/linolzhang/article/details/76285326

版权

本文深入介绍了轻量级神经网络PVANet和ShuffleNet的设计理念与优势。PVANet通过改进的C.ReLU、Inception结构和深度网络训练策略实现高效实时检测。ShuffleNet则利用Group Convolution、Channel Shuffle技术降低计算量，提升模型效率。这两款网络在保持高精度的同时，显著降低了计算需求，适用于移动设备和实时系统。

摘要由CSDN通过智能技术生成

一. PVANet

论文：PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection 【点击下载】

Caffe代码：【Github】

设计了一种轻量级的网络，取名叫 PVANet，特点是 Channel少、Layer多，在 VOC2007 和 VOC2012 精确度分别达到了 84.9% 和 84.2%，但计算量不到采用 ResNet-101 网络的 10%。

论文的核心要点：

1）改进的 C.ReLU

  前面几层 用到了 CReLU，Concatenated Rectified Linear Units。

CReLU 来源于在 AlexNet 上的一个有趣的实验（参考论文【CReLU】）：低层的卷积层中的一些滤波器核存在着负相关程度很高的滤波器核，而层次越高的卷积层，这一现象越不明显。作者把这一现象称为 pairing phenomenon。

根据这种特性，通过 Negation 实现 Concatenation，在不损失精度的情况下可以减少一半计算量。

作者基于 CReLU 进行了改进，添加了 Scale/Bias 层（见下图左），允许每个channel（通道）的斜率和激活阈值与其相反的 Channel 不同。

2）使用 Inception Net

“Inception 没有广泛应用在现有网络中”，目前来看使用的确实也不少了，不纠结这个，Inception 的优点是通过不同尺度的卷积核对应不同大小的感受野，从而适应不同大小的目标。

上图右侧是 Inception 的网络结构，作者用两个 3*3 的 Conv 替代 5*5 的 Conv，其中 1*1 的 Conv保留特征尺度，直接连接定义残差。

3）深度网络训练

a）使用了 Residual Net 和 BN（Batch Norm），ResNet 与 Inception Layer 连接；

b）通过自定义策略 “Plateu” 动态调整学习率，如果 moving average of loss 在迭代周期内低于一个预设值，触发 “on-plateau”，将学习率动态减少一个常量。

从一般意义上来说，动态调整学习率可以有效避免震荡，提高训练精度。

4）整体设计

以表的形式给出各层的 Detail：



5）Hyper-feature concatenation

多尺度的特征组合在很多文献中都有大量应用，文中用在目标检测上，能够对多尺度的目标进行有效检测。

如下图所示，采用了三个不同 Scale 进行 Feature 联合。

PVA 是个轻量级网络，基本能够达到实时（Titan X），对于实时系统应用的童鞋可以考虑。

【训练过程】

1）安装 Caffe 依赖库

必要的 caffe 依赖库：

   sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
   sudo apt-get install --no-install-recommends libboost-all-dev
   sudo apt-get install libatlas-bas