提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
美国邮政服务USPS手写数字识别库,库中为16×16像素的灰度图像,共有9298个手写数字图像。对于要做迁移学习(Transfer Learning)、连续学习(Life Long learning)等的研究来说,是除mnist之外又一实用的数据集。下载的数据为.mat文件,使用matlab进行处理 。
https://www.dssz.com/556480.html
一、数据可视化
示例:下载的数据USPS手写体图像是以一维向量的形式保存的,用imshow画图前先进行转化。
image = [];
for i = 1:16
image = [image;fea(1,16*(i-1)+1:16*i)];
end
image = padarray(image,[6 6]);%零填充
imshow(image,'InitialMagnification','fit');
二、数据处理
1.图像插值
USPS图像像素是16×16,为了与mnist手写体数据集同步,需转化成28×28像素。本次采用零填充的方法进行图像插值。
%%%16x16扩展成28x28%%%
fea_train = [];gnd_train = [];%训练数据和标签
fea_test = [];gnd_test = [];%测试数据和标签
fea_cp = fea;fea_cp(fea_cp<0) = 0;
for n = 1:9298
image = [];
%展开为二维矩阵方便零填充
for i = 1:16
image = [image;fea_cp(n,16*(i-1)+1:16*i)];
end
image = padarray(image,[6 6]);%零填充
fea_train(n,:,:) = image;%转为三维矩阵
end
2.划分训练集和测试集
调整label的值,并将大约9千个图像数据分成训练集和测试集。
%%%train and test part%%%
fea_test = fea_train(7292:end,:,:);fea_train = fea_train(1:7291,:,:);
gnd = gnd - 1;%标记为1-10 改成0-9
gnd_train = gnd(1:7291);gnd_test = gnd(7292:end);
三、下载链接
处理好的代码下载链接:https://download.csdn.net/download/SCNU_wenweikun/15844690