SVHN数据集介绍
SVHN(Street View House Number)Dateset 来源于谷歌街景门牌号码,每张图片中包含一组 ‘0-9’ 的阿拉伯数字。图片如下图所示,训练集中包含 73257 个数字,测试集中包含 26032 个数字,另有 531131 个附加数字。
该篇博客下载的数据集含有三个.mat 的文件:train_32x32.mat, test_32x32.mat, extra_32x32.mat。
所有数字都已调整为32 x 32像素的固定分辨率。加载.mat文件会创建2个变量:X是包含图像的4-D矩阵,y是类标签的向量。为了访问图像,X(:,:,:,i)给出第i个32×32 RGB图像,其类标签为y(i)。
处理后的图片如下,该图片借用了可思数据网站,若侵权可删。
SVHN数据集处理
python代码如下:
import scipy.io as sio
import numpy as np
def load_data(f):
train = sio.loadmat(f + "/train_32x32.mat")
test = sio.loadmat(f + '/tes