目标检测 YOLO v3 训练 人脸检测模型

本文介绍了如何使用YOLO v3算法训练一个高精度的人脸检测模型。作者提供了从WIDER FACE数据集转换数据格式的方法,详细阐述了训练过程,包括数据准备、模型创建、训练参数设置,并给出了训练和验证的步骤。最后,讨论了提升检测效果的策略。
摘要由CSDN通过智能技术生成

YOLO,是You Only Look Once的缩写,一种基于深度卷积神经网络的物体检测算法,YOLO v3是YOLO的第3个版本,检测算法更快更准。

本文源码https://github.com/SpikeKing/keras-yolo3-detection

欢迎Follow我的GitHubhttps://github.com/SpikeKing

YOLO

YOLO v3已经提供 COCO(Common Objects in Context)数据集的模型参数。我们可以把COCO的模型参数作为预训练参数,再结合已有的数据集,创建自己的检测算法。

本例使用WIDER FACE人脸数据,训练一个高精度的人脸检测模型。

WIDER

数据集:WIDER Face

WIDER

建立时间:2015-11-19

WIDER FACE 数据集是一个人脸检测基准(benchmark)数据集,图片选取自 WIDER(Web Image Dataset for Event Recognition) 数据集。图片数 32,203 张,人脸数 393,703 个,在大小(scale)、位置(pose)、遮挡(occlusion)等不同形式中,人脸是高度变换的。WIDER FACE 数据集是基于61个事件类别,每个事件类别,随机选取训练40%、验证10%、测试50%。训练和测试含有边框(bounding box)真值(ground truth),而验证不含。

数据集在官网可以公开下载,其中在Face annotations 中,wider_face_train_bbx_gt.txt是边框真值,数据格式如下:

0--Parade/0_Parade_marchingband_1_849.jpg
1
449 330 122 149 0 0 0 0 0 0 

数据说明:

  • 第1行:图片的位置和名称;
  • 第2行:边框的数量;
  • 第3~n行:每个人脸的边框和属性:
    • 其中1~4位是x1, y1, w, h
    • blur:模糊,0清晰、1一般、2严重;
    • expression:表情,0正常、1夸张;
    • illumination:曝光,0正常、1极度;
    • occlusion:遮挡,0无、1部分、2大量;
    • pose:姿势,0正常,1非典型;

wider_face_val_bbx_gt.txt与此类似。

图片数据的清晰度一般,大小不一,尺寸为1024x,宽度相同。

数据转换

为了符合训练要求,需要转换wider数据集中的边框格式,为训练要求的边框格式。

即文件路径,边框xmin,ymin,xmax,ymax,label

data/WIDER_val/images/10--People_Marching/10_People_Marching_People_Marching_2_433.jpg 614,346,771,568,0 245,382,392,570,0 
  • 10
    点赞
  • 91
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 13
    评论
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CarolineSpike

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值