赛题理解
一开始以为在测试集上是要通过原图去预测门牌号码的,也就是说模型要能找到门牌号的位置。
后来又读了几遍比赛要求,发现位置信息全都提供了,那么这个问题就容易很多,单纯的识别数字信息。
数字的位数问题可以通过简单的算法来解决。
读取数据看一看
1.使用 pandas 读取训练集数据
json = pd.read_json('mchar_train.json')
2.把门牌号信息处理一下,加入到上面的表格里
label2 = []
for i in range(len(json['label'])):
num = ''.join(map(str,json['label'][i]))
label2.append(num)
json['label2'] = label2
看一下效果