数据集是我人工筛选的,难免有不足!
一直做的是火焰检测方面的课题,但是下载过很多不同的数据集,感觉这些数据集的质量参差不齐,有些图片可以用清朝老图来形容,而且各个数据集之间图片非常重复,实在是受不了,借着最近做课题的安排,重新整理了一份数据集。
数据来源于多个公共火灾数据集,包括Bilkent大学火焰视频库VisiFire,BoWFire Dataset,FD-Dataset,北亚利桑那大学的无人机火焰图像数据集,搜索引擎搜索和网络火焰火焰视频截取等。将收集到的数据集中的图像进行筛选,因为有些数据集年份久远,其中图片的质量难以保证,所以需要对其进行优化。剔除画质模糊不清,无法判断目标的图像,去掉重复图像以及不含真实火焰的图像,最终万张图像经过筛选仅剩2366张,并划分为大中小三个尺度的火焰图像,我也没想到最终只剩了这点。
因为这块内容我是想做小火焰目标的检测,所以划分了大中小三个数据集,因为图像分辨率跨度比较大,所以没有使用COCO数据集的像素划分方式,主要是根据火焰的矩形包围框的面积相对于图像的面积作为判断标准。将火焰矩形包围框面积小于总图像大小的百分之一的目标认为是小尺度火焰目标,将火焰矩形包围框面积占总图像大小的百分之一到百分之十的目标认为是中尺度火焰目标,而剩下的火焰目标则被认为是大尺度火焰目标,其统计结果:得到的大尺度火焰目标图像818张,中尺度火焰目标图像1123张,小尺度火焰图像425张。
数据集链接:https://pan.quark.cn/s/0cc6723dff19
可以看出在数据集中,中尺度火焰和大尺度火焰占据了很大的一部分,而小尺度火焰的样本数量较少,这对小尺度火焰目标的特征学习是很不利的,因此需要增加小尺度火焰的样本数,以提高对小尺度火焰特征的学习。
我是先进行的数据集划分,在进行数据集增强的,按照6:2:2的比例划分。拟采用角度变换、复制粘贴对原始的小尺度目标数据集进行扩充。同时使用中尺度目标测试集中一部分图像进行平铺拼接用于扩充小尺度目标图像测试集。
我使用的网络是YOLOv5,然后初步实验使用原始数据集和增强后的数据集分别训练网络之后,会有一丢丢的提升。有结果后续再进行更新。