需要数据小伙伴们,登录阿里云天池比赛,报名后可以将数据下载。
零基础入门CV赛事- 街景字符编码识别
以一张图片为例,读取数据集中的信息。
1 数据标签
在数据集中,训练每张图片将给出对应的编码标签,和具体的字符框的位置。
field | description |
---|---|
top | 左上角坐标X |
height | 字符高度 |
left | 左上角坐标Y |
width | 字符宽度 |
label | 字符编码 |
图片中字符的位置坐标
2 调用package:
import numpy as np
import json
import cv2
import matplotlib.pyplot as plt
train_json = json.load(open('C:/Users/Administrator/jupyter_work/input/mchar_train.json')) # mchar_train.json 存放的路径
print("未处理前的000000.png字符款的位置信息: ", train_json['000000.png']) # 调用字典中的数据
输出的结果为:
未处理前的000000.png字符框的位置信息: {
'height': [219, 219], 'label': [1, 9], 'left': [246, 323], 'top': [77, 81],