街景字符识别-Task1.赛题理解
赛题理解任务概览
- 赛题数据
- 数据标签
- 评测指标
- 数据读取
- 解题思路
1.赛题数据
赛题数据来自收集的SVHN街道字符,其中训练集包括3W张照片,验证集包括1W张照片,每张照片包括了颜色图像和对应的编码类别以及具体位置;测试集A包括4W张照片,测试集B包括4W张照片。
2、数据标签
训练集、测试集与验证集中都给出了相对应的编码标签和具体的字符框位置,可用于训练模型:
字符说明:
Field | Description |
---|---|
top | 左上角坐标X |
height | 字符高度 |
left | 左上角坐标Y |
width | 字符宽度 |
label | 字符编码 |
3、评测指标
评价指标计算公式如下:
score=编码识别正确的数量 / 测试集图片的数量
结果当然是越大越好。
4、读取数据
JSON中标签的读取方式:
import json
import matplotlib.pyplot as plt
import numpy as np
import cv2
train_json = json.load(open('D:\\tianchi_char\\mchar_train.json'))