1 发现问题
笔者发现,CCPD数据集关于车牌关键点的标注达不到理想效果,而优秀的数据是训练一个优秀模型的基础。因此笔者在CCPD2019及CCPD2020数据集中各取2500张,并对这5000张数据进行重新标注。
2 验证
笔者先针对CCPD2020数据集重新标注了2000张数据,并使用这2000张数据训练YOLOv8s-pose关键点检测模型,接着与使用CCPD2020原始数据集中的10000张图片训练出的模型预测效果进行对比,发现前者在测试集(500张数据)上的准确度提高了26.7%,肉眼可见的效果提升如下图所示:
3 重新标注后的高质量数据
CCPD5000HQ数据集:GitHub链接 欢迎star~~
CCPD5000HQ包含了图片以及对应的.json标注文件,可以直接用Labelme打开。
CCPD5000HQ_YOLO包含了图片以及对应的YOLO格式的标注文件,并且划分了训练集、验证集、测试集,可以直接拿来训练YOLOv8模型。