一、赛题目的
赛题来源自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。
赛题的要求是根据给出的图片,识别图片上的数字(门牌号)。
二、赛题数据
对于每张图片还会给予数据标签,目的是确定字符的具体位置。
三、评价标准
Score=编码识别正确的数量/测试集图片数量
四、最简单的解题思路
赛题本质是分类问题,需要对图片的字符进行识别。但赛题给定的数据图片中不同图片中包含的字符数量不等,如下图所示。有的图片的字符个数为2,有的图片字符个数为3,有的图片字符个数为4。
可以将赛题抽象为一个定长字符识别问题,在赛题数据集中大部分图像中字符个数为2-4个,最多的字符 个数为6个。
因此可以对于所有的图像都抽象为6个字符的识别问题,字符23填充为23XXXX,字符231填充为231XXX。
经过填充之后,原始的赛题可以简化了6个字符的分类问题。在每个字符的分类中会进行11个类别的分类,假如分类为填充字符,则表明该字符为空。
11个类别【0,1,2,3,4,5,6,7,8,9,X】。