一、赛题理解
1、赛题介绍
-
赛题名称:街景字符编码识别 / 街景门牌号码识别
-
赛事链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction
-
数据集:
- 原数据集为SVHN街景门牌号码数据集, 链接:http://ufldl.stanford.edu/housenumbers/
-
比赛使用数据集:对SVHN进行匿名处理和噪音处理后的数据集
- 每张照片包括颜色图像和对应的编码类别和具体位置,训练集、验证集和测试集中标注了字符的位置框
- 所有的数据(训练集、验证集和测试集)的标注使用JSON格式,并使用文件名进行索引。如果一个文件中包括多个字符,则使用列表将字段进行组合。
-
数据集划分:
-
训练集:3W张照片,mchar_train.json,mchar_train文件夹
-
验证集:1W张照片,mchar_val.json,mchar_val文件夹
-
测试集A:4W张照片,mchar_test_a
-
测试集B:4W张照片
-
-
数据标签:训练和验证数据集中,图片中字符对应的编码标签和具体的字符框的位置
Field | Descriptio |
---|