前言
之前参加阿里天池比赛,好久了,一直没有时间整理,现在临近毕业,趁论文外审期间,赶紧把东西整理了,5月底学校就要让我们滚蛋了,哭哭哭!!!大运会的牺牲品!!!
一、街景字符编码识别
先说一下比赛的基本情况吧,没有认真比赛,所以,你懂的,下面提供一下比赛连接和我的代码连接,感兴趣的小伙伴可以下载玩一玩哈。
比赛连接:https://tianchi.aliyun.com/competition/entrance/531795/introduction
代码连接:https://pan.baidu.com/s/1xN44KpPPxdUoEdIM9Vkvhw 提取码:fasf
1. 目标
先简单的介绍一下这个比赛,其实就是目标检测,就是把真实场景的门派号识别出来,任务就是把下面这种图片的数字按照从左到右的方式识别出来,有的人是不是已经想到了这是一个10个类的目标检测任务
2. 数据集
该数据来自真实场景的门牌号。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。
数据集图像长这样子,格式是.png
数据集标签长这样子,格式是json
需要注意的是json格式给出了一下信息,如果需要用yolov5的话,要转化为中心点+长宽的格式top 左上角坐标Y height 字符高度 left 左上角坐标X width 字符宽度 label 字符编码
3. 指标
交结果与实际图片的编码进行对比,以编码整体识别准确率为评价指标,结果越大越好,具体计算公式如下:
S c o r e = 编 码 识 别 正 确 的 数 量 / 测 试 图 片 数 量 \ Score= 编码识别正确的数量 / 测试图片数量 Score=编码识别正确的数量/测试图片数量
总结
以上就是今天要讲的内容,后面有时间我讲一篇详细的使用yolov5参加比赛的博客吧。