题目理解
题目名称
零基础入门CV之街道字符识别
题目目标
通过这道题走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。
题目任务
以计算机视觉中字符识别为背景,预测街道字符编码,题目数据采用公开数据集SVHN。
训练数据
数据标签
对于训练数据每张图片将给出对应的编码标签,和具体的字符框的位置,可用于模型训练:
Field | Description |
---|---|
top | 左上角坐标X |
height | 字符高度 |
left | 左上角坐标Y |
width | 字符宽度 |
label | 字符编码 |
字符坐标具体如下:
评测指标
具体计算公式如下:
Score=编码识别正确的数量/测试集图片数量
读取数据
JSON中标签的读取方式:
import json
train_json = json.load(open('../input/train.json'))
# 数据标注处理
def parse_json(d):
arr = np.array([
d['top'