参考文献:
《Pelee: A Real-Time Object Detection System on Mobile Devices》
Code: https://github.com/Robert-JunWang/Pelee
提出的 PeleeNet,通过设计高效的卷积方式并与移动设备硬件的运行库结合, 能够对移动设备上的目标检测、图像分类等任务进行实时预测. 使用 PeleeNet 在 iphone8 上实现目标检测任务, 可达到 23.6 FPS(Frames PerSecond, 每秒传输帧数), 且准确率较高
主要贡献:
提出一种高效CNN结构Peleenet,用卷积代替深层分离卷积
提出一种实时检测系统,将Peleenet与SSD结合,提高检测速度
结构特点:
1.两路密接层,
一路采用33卷积核,一路采用堆叠的33卷积核学习大型目标的视觉模式
2.茎块,在不添加计算负担的同时提高特征表达能力
3.瓶颈层的自动调节通道数,依据输入尺寸变化
4.未压缩的传输层,保持输入输出通道数不变
5.在推理阶段将batchnorm层与conv层融合
采用SDD优化网络结构
1.五种特征图尺寸选择19,10,5,3,1
2.残差预测模块
3.1*1卷积核
设计部分:
总的结构包含一个茎块和4个特征获取阶段(解释了一下为什么不用已经提出的3个特征获取阶段,因为不成熟的取减少特征映射尺寸会减弱表达能力)
采用的数据集,图片分类,斯坦福的dog,和ILSVRC2012,前者数