全文概括
本文的基本网络框架是YOLO,但用两层 conv 代替 两层 fc 。然后用 8-bit 量化了训练好的网络权重。
Introduction
8-bit 量化回归任务,会比量化分类任务更容易造成精度下降。
经过试验显示,本文方法(量化后)的最高检测率比量化前的只低不到
1
2
%
1~2\%
1 2%,但在帧率上达到了
20
20
20x 倍的提升。
YOLO使用的基础框架是 GoogleNet,即使将框架系统变成 AlexNet,其在嵌入设备上最多也只能每秒跑 5 5 5帧。
Methods
Network Architecture
和YOLO相比,YOLO在除了最后一层,激活函数都选择 LeakyReLU ,而本文选择 ReLU。YOLO在最后一层不使用激活函数,而本文对不同的任务选择不同激活函数,分类(softmax),置信度(sigmoid),定位(不使用激活函数)。
训练过程和YOLO一样,损失函数也一直,除了 λ n o o b j = 1 \lambda_{noobj}=1 λnoobj=1,而YOLO的该参数为 0.5 0.5 0.5。
Quantized Network
作者认为量化回归任务比分类任务难的原因:
The justification for the high accuracy in low-precision modes comes from the fact that the final activation is a probability i.e. in [0,1] intervals, can be represented with an unsigned number without any concern on scaling.