MaixHub平台:MaixHub
一、安全帽数据集下载
国外kaggle数据集:Safety Helmet Detection | Kaggle
国内和鲸社区: 和鲸社区 - Heywhale.com
两个网站都需要先注册,才能下载数据集。
两个数据集有5000个样本,标签为xml格式,数据集为VOC格式,可以直接导入MaixHub,不过MaixHub训练最多支持3000个样本,所以需要提取部分出来导入。
kaggle下载的数据集包含两个文件夹,images(图片)、annotations(标签)
和鲸社区下载的数据集包含三个文件夹,train(训练集图片)、label(训练集的标签)、test(测试集图片)
二、训练模型
1、数据集压缩包要求
- 文件格式为 zip 压缩包,大小500M以内
- 数据集格式:同 Pascal VOC 数据集
- 图片数量限制为3000张,超出该数量的图片会被忽略
- 压缩包内应包含 images 文件夹和 xml 文件夹;一张图片对应一个名字相同的 xml 标注文件
- 目录结构
2、上传训练集
使用kaggle下载的数据集,使用其中1600张图像作为训练集。创建一个safety_helmet_train文件,再创建images和xml两个子文件夹。拷贝1600张图像到images文件夹中,hard_hat_workers0.png到hard_hat_workers1599.png,拷贝1600个xml标签到xml文件夹中,hard_hat_workers0.xml到hard_hat_workers1599.xml,然后将safety_helmet_train压缩为zip文件夹。进入到以下页面导入训练集。
3、上传验证集
使用kaggle下载的数据集,使用其中1600张图像作为训练集。创建一个safety_helmet_test文件,再创建images和xml两个子文件夹。拷贝1600张图像到images文件夹中,hard_hat_workers1600.png到hard_hat_workers1999.png,拷贝400个xml标签到xml文件夹中,hard_hat_workers1600.xml到hard_hat_workers1999.xml,然后将safety_helmet_test压缩为zip文件夹。进入到以下页面导入验证集。
4、训练记录
训练进行中
训练完成
5、训练结果分析
在验证集上第80次训练迭代有最佳准确率:0.062,准确率太低。
一些识别错误样本: