Datawhale 零基础入门CV赛事-Task1 赛题理解
街景字符识别比赛(赛题理解)
比赛链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction?tdsourcetag=s_pctim_aiomsg
1.比赛及数据介绍
该比赛主要是预测街道字符编码,是一个典型的字符识别问题,采用数据为SVHN。需要下载的数据如下:
下载完成后如下图所示。其中json文件是标注的ground truth,zip文件中为图片数据。.csv中则是提交所需文件的示例。
2.数据格式介绍
图片数据为.png格式
标签数据则表示为:
“图片名":
{“height”: [第一个字符的高度W1, 第二个字符的左上角坐标X2,…,第n个字符的高度Wn],
“label”: [第一个字符的标签L1, 第二个字符的标签L2,…,第n个字符的标签Ln],
“left”: [第一个字符的左上角坐标Y1, 第二个字符的左上角坐标Y2,…,第n个字符的左上角坐标Yn],
“top”: [第一个字符的左上角坐标X1, 第二个字符的左上角坐标X2,…,第n个字符的左上角坐标Xn],
“width”: [第一个字符的宽度W1, 第二个字符的左上角坐标X2,…,第n个字符的宽度Wn]}
3.解题思路
将每个字符作为目标进行检测,先检测出每个字符,再进行分类,最后通过字符的位置进行从左至右的排序,输出最终图片中包含的字符。