目标检测 YOLO v3 训练人脸检测模型

最新推荐文章于 2024-07-19 13:44:40 发布

CarolineSpike

最新推荐文章于 2024-07-19 13:44:40 发布

阅读量1.9w

点赞数 10

文章标签： Mystra YOLO v3 人脸训练

本文链接：https://blog.csdn.net/caroline_wendy/article/details/80924371

版权

本文介绍了如何使用YOLO v3算法训练一个高精度的人脸检测模型。作者提供了从WIDER FACE数据集转换数据格式的方法，详细阐述了训练过程，包括数据准备、模型创建、训练参数设置，并给出了训练和验证的步骤。最后，讨论了提升检测效果的策略。

摘要由CSDN通过智能技术生成

YOLO，是You Only Look Once的缩写，一种基于深度卷积神经网络的物体检测算法，YOLO v3是YOLO的第3个版本，检测算法更快更准。

本文源码：https://github.com/SpikeKing/keras-yolo3-detection

欢迎Follow我的GitHub：https://github.com/SpikeKing

YOLO

YOLO v3已经提供 COCO（Common Objects in Context）数据集的模型参数。我们可以把COCO的模型参数作为预训练参数，再结合已有的数据集，创建自己的检测算法。

本例使用WIDER FACE人脸数据，训练一个高精度的人脸检测模型。

WIDER

数据集：WIDER Face

WIDER

建立时间：2015-11-19

WIDER FACE 数据集是一个人脸检测基准（benchmark）数据集，图片选取自 WIDER（Web Image Dataset for Event Recognition）数据集。图片数 32,203 张，人脸数 393,703 个，在大小（scale）、位置（pose）、遮挡（occlusion）等不同形式中，人脸是高度变换的。WIDER FACE 数据集是基于61个事件类别，每个事件类别，随机选取训练40%、验证10%、测试50%。训练和测试含有边框（bounding box）真值（ground truth），而验证不含。

数据集在官网可以公开下载，其中在Face annotations 中，wider_face_train_bbx_gt.txt是边框真值，数据格式如下：

0--Parade/0_Parade_marchingband_1_849.jpg
1
449 330 122 149 0 0 0 0 0 0

数据说明：

第1行：图片的位置和名称；
第2行：边框的数量；
第3~n行：每个人脸的边框和属性：
- 其中1~4位是x1, y1, w, h
- blur：模糊，0清晰、1一般、2严重；
- expression：表情，0正常、1夸张；
- illumination：曝光，0正常、1极度；
- occlusion：遮挡，0无、1部分、2大量；
- pose：姿势，0正常，1非典型；

wider_face_val_bbx_gt.txt与此类似。

图片数据的清晰度一般，大小不一，尺寸为1024x，宽度相同。

数据转换

为了符合训练要求，需要转换wider数据集中的边框格式，为训练要求的边框格式。

即文件路径，边框xmin,ymin,xmax,ymax,label：

data/WIDER_val/images/10--People_Marching/10_People_Marching_People_Marching_2_433.jpg 614,346,771,568,0 245,382,392,570,0

最低0.47元/天解锁文章

CarolineSpike

关注

10
点赞
踩
91

收藏

觉得还不错? 一键收藏
打赏
13
评论
目标检测 YOLO v3 训练人脸检测模型

YOLO，是You Only Look Once的缩写，一种基于深度卷积神经网络的物体检测算法，YOLO v3是YOLO的第3个版本，检测算法更快更准。YOLO v3已经提供 COCO（Common Objects in Context）数据集的模型参数。我们可以把COCO的模型参数作为预训练参数，再结合已有的数据集，创建自己的检测算法。本例使用WIDER FACE人脸数据，训练一个高...
复制链接

扫一扫