深度学习-Ultra-Light-Fast-Generic-Face-Detector-1MB网络结构详解

最新推荐文章于 2024-08-08 08:28:10 发布

陈塬升

最新推荐文章于 2024-08-08 08:28:10 发布

阅读量1.4k

点赞数 1

分类专栏：深度学习文章标签：深度学习计算机视觉 python 机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/INFINALGEORGE/article/details/106525527

版权

深度学习专栏收录该内容

11 篇文章 1 订阅

订阅专栏

近日，用户Linzaer在Github上开源了一款适用于边缘计算设备、移动端设备以及 PC 的超轻量级通用人脸检测模型，该模型文件大小仅1MB，一经开源就霸榜Github Trending榜单。
在这里插入图片描述
短短几天时间，已经在Github上标星2.1K，398个Fork（Github地址：https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB）

据Linzaer介绍，该模型设计是针对边缘计算设备或低算力设备(如用ARM推理)设计的，可以在低算力设备中如用ARM进行实时的通用场景的人脸检测推理，同样适用于移动端、PC。
640?wx_fmt=jpeg
主要具有如下特性：
在模型大小上，默认FP32精度下（.pth）文件大小为 1.04~1.1MB，推理框架int8量化后大小为 300KB 左右。

在模型计算量上，320x240的输入分辨率下 90~109 MFlops左右。

模型有两个版本，version-slim(主干精简速度略快)，version-RFB(加入了修改后的RFB模块，精度更高)。

提供了320x240、640x480不同输入分辨率下使用widerface训练的预训练模型，更好的工作于不同的应用场景。

支持onnx导出，便于移植推理。

目前测试过正常的运行环境如下：
Ubuntu16.04、Ubuntu18.04、Windows 10（inference）

Python3.6

Pytorch1.2

CUDA10.0 + CUDNN7.6

精度、速度、模型大小比较
训练集是使用Retinaface提供的清理过的widerface标签配合widerface数据集生成VOC训练集
Widerface测试

在WIDER FACE test集测试精度（单尺度输入分辨率：320*240 或按最大边长320等比缩放）
640?wx_fmt=png

在WIDER FACE test集测试精度（单尺度输入分辨率：VGA 640*480 或按最大边长640等比缩放）
640?wx_fmt=png
在这里插入图片描述
终端设备推理速度

树莓派4B MNN推理测试耗时 (单位：ms)（ARM/A72x4/1.5GHz/输入分辨率 : 320x240 /int8量化）
640?wx_fmt=png

模型大小比较
640?wx_fmt=png

图片效果如下：

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg
在移除了 10*10 像素以下的极小人脸后，这个超轻量人脸检测模型能识别该图中的335张人脸。

至此 VOC 训练集准备完毕，项目根目录下分别有 train_mb_tiny_fd.sh 和 train_mb_tiny_RFB_fd.sh 两个脚本，前者用于训练 slim 版本模型，后者用于训练 RFB 版本模型，默认参数已设置好，参数如需微调请参考 ./train.py 中关于各训练超参数的说明。

下载地址：https://pan.baidu.com/share/init?surl=m600pp-AsNot6XgIiqDlOw

提取码：x5gt

原文链接：https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

陈塬升 CSDN认证博客专家 CSDN认证企业博客

码龄5年

61: 原创

8万+: 周排名

194万+: 总排名

11万+: 访问

: 等级

1348: 积分

29: 粉丝

123: 获赞

12: 评论

386: 收藏

私信

关注

热门文章

分类专栏

深度学习 11篇
Camera算法 1篇
内核编程
工具及网站 1篇
python 7篇
机器学习 11篇
c++ 2篇
OpenCL 23篇
GPU 4篇
sql 1篇
鸡汤 1篇

最新评论

机器学习-多元线性回归（multiple linear regression）
Clare Adess: ValueError: Expected a 2-dimensional container but got <class 'pandas.core.series.Series'> instead. Pass a DataFrame containing a single row (i.e. single sample) or a single column (i.e. single feature) instead.代码整个复制下来报错0.0好像是数据格式有问题，这个怎么解决呀
vim编辑器替换以及全局替换
低调小冯: 哥们厉害
OpenCL 映射和解映射
67373_: 你好博主，我现在创建了映射，但是在核函数内读不到数据是什么原因？
深度学习-Ultra-Light-Fast-Generic-Face-Detector-1MB网络结构详解
weixin_46914428: 你倒是详解网络结构呀，复制粘贴算啥
OpenCL 图像处理函数、图像放缩和插值
海清: 请教，opencl对图像进行缩放，需要把输入图像转换成rgba类型的格式才能供read_imagef和write_imagef两个函数使用，而rgb转rgba及rgba转rgb比较耗时，那怎么能直接处理rgb类型的图像呢？谢谢

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。