天池SVHN的数据
训练集:3万张图像
验证集:1万张图像
测试集A/B:4万张图像【B数据集为比赛用】
对于每张图像提供一个json对象
- 属性:
1.读取图片以及json属性
import json
import cv2
import numpy as np
from matplotlib import pyplot as plt
train_json = json.load(open('/content/drive/My Drive/drive/SVHN/mchar_train.json'))
def parse_json(d):
arr = np.array([d['top'],d['height'],d['left'],d['width'],d['label']])
arr = arr.astype(int)
return arr
img = cv2.imread('/content/drive/My Drive/drive/SVHN/mchar_train/018292.png')
arr = parse_json(train_json['018292.png'])
plt.subplot(1,arr.shape[1]+1,1),plt.imshow(img),plt.xticks([]),plt.yticks([])
for i in range(arr.shape[1]):
plt.s