搬来了大赛仪表盘读数识别德国冠军方案解读 , 大佬勿怪
1、仪表识别
对于预测仪表框与真实仪表框,计算f1-score,IoU使用0.7,此部分成绩记为score1
2、刻度点识别
对于预测关键点与真实关键点,计算RMSE,此部分成绩记为score2
3、OCR识别
对于预测的数值框,计算f1-score,IoU使用0.5,此部分成绩记为score3
4、读数识别
计算每个仪表的读数得分,并对所有仪表的得分求平均值,此部分成绩记为 score4
将上述4点得到4项成绩进行加权,最终得分:
加权的权重为配置参数,默认值为:
weight_1 = 0.1
weight_2 = 0.25
weight_3 = 0.25
weight_4 = 0.4
赛题分析
本次任务的仪表数据集存在以下难点:
1、仪表刻度存在遮挡、模糊等问题,影响OCR识别
2、仪表图像存在旋转、倾斜问题,影响读数测量
算法设计
算法分为4个流程,首先用yolov5s模型从原图中识别出仪,接着用yolov8x-pose模型检测出仪表中的刻度线、指针的关键点,再用DBNetpp模型检测出数值框并用SATRN模型进行文本识别,最后后处理得到读数结果。
(1)基于YOLOv5s的仪表检测
选型理由
Yolov5s网络小&