深度学习-Ultra-Light-Fast-Generic-Face-Detector-1MB网络结构详解

近日,用户Linzaer在Github上开源了一款适用于边缘计算设备、移动端设备以及 PC 的超轻量级通用人脸检测模型,该模型文件大小仅1MB,一经开源就霸榜Github Trending榜单。
在这里插入图片描述
短短几天时间,已经在Github上标星2.1K,398个Fork(Github地址:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB)
在这里插入图片描述
据Linzaer介绍,该模型设计是针对边缘计算设备或低算力设备(如用ARM推理)设计的,可以在低算力设备中如用ARM进行实时的通用场景的人脸检测推理,同样适用于移动端、PC。
640?wx_fmt=jpeg
主要具有如下特性:
在模型大小上,默认FP32精度下(.pth)文件大小为 1.04~1.1MB,推理框架int8量化后大小为 300KB 左右。

在模型计算量上,320x240的输入分辨率下 90~109 MFlops左右。

模型有两个版本,version-slim(主干精简速度略快),version-RFB(加入了修改后的RFB模块,精度更高)。

提供了320x240、640x480不同输入分辨率下使用widerface训练的预训练模型,更好的工作于不同的应用场景。

支持onnx导出,便于移植推理。

目前测试过正常的运行环境如下:
Ubuntu16.04、Ubuntu18.04、Windows 10(inference)

Python3.6

Pytorch1.2

CUDA10.0 + CUDNN7.6

精度、速度、模型大小比较
训练集是使用Retinaface提供的清理过的widerface标签配合widerface数据集生成VOC训练集
Widerface测试

在WIDER FACE test集测试精度(单尺度输入分辨率:320*240 或按最大边长320等比缩放)
640?wx_fmt=png

在WIDER FACE test集测试精度(单尺度输入分辨率:VGA 640*480 或按最大边长640等比缩放 )
640?wx_fmt=png
在这里插入图片描述
终端设备推理速度

树莓派4B MNN推理测试耗时 (单位:ms)(ARM/A72x4/1.5GHz/输入分辨率 : 320x240 /int8量化)
640?wx_fmt=png

模型大小比较
640?wx_fmt=png

图片效果如下:

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg
在移除了 10*10 像素以下的极小人脸后,这个超轻量人脸检测模型能识别该图中的335张人脸。

至此 VOC 训练集准备完毕,项目根目录下分别有 train_mb_tiny_fd.sh 和 train_mb_tiny_RFB_fd.sh 两个脚本,前者用于训练 slim 版本模型,后者用于训练 RFB 版本模型,默认参数已设置好,参数如需微调请参考 ./train.py 中关于各训练超参数的说明。

下载地址:https://pan.baidu.com/share/init?surl=m600pp-AsNot6XgIiqDlOw

提取码:x5gt

原文链接:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值