USPS数据集处理及下载方法

  • 最近在弄迁移学习模型,需要用到USPS数据集,这个数据集网上版本很多,我的是20000条28*28的USPS图片,这个应该是数量最多的一个版本。
  • 我是下载的mat文件,我想转化成么这种形式:
    在这里插入图片描述
    下面是转化代码:
from scipy.io import loadmat
import torch
from torchvision import transforms
from tqdm import tqdm
import os


m = loadmat("E:/transferlearning/data/usps/Usps.mat")
rootpath="E:/transferlearning/data/usps/"
print(m.keys())
print(type(m['feas']))
print(type(m['label']))

print(m['feas'][0].shape)
print(m['label'].shape)
toPIL = transforms.ToPILImage() #这个函数可以将张量转为PIL图片,由小数转为0-255之间的像素值
for index,img in tqdm(enumerate(m['feas'])):
    endPath=rootpath+str(m['label'][index])[1]
    if not os.path.exists(endPath):
        os.makedirs(endPath)
        
    img=m['feas'][index].reshape((28,28));
    img = torch.from_numpy(img)
    pic = toPIL(img)
    pic.save(endPath+'/'+str(len(os.listdir(endPath)))+'.jpg')

顺便分享一种方法:

import torch
from torchvision import transforms
 
toPIL = transforms.ToPILImage() #这个函数可以将张量转为PIL图片,由小数转为0-255之间的像素值
img = torch.randn(3,128,64)
pic = toPIL(img)
pic.save('random.jpg')

可以快速将小数tensor转化为图片保存。

  • 附上我处理的数据压缩包,大家可以前往下载。
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
USPS数据集是一个常用的手写字体数据集,主要用于模式识别、图像处理机器学习等领域的研究。它包含一系列的手写数字图像样本,每个样本大小为16x16像素,共有10个类别,分别代表数字0-9。 KNN(最近邻居)算法是一种基本的分类算法,它通过计算一个样本与训练集中所有样本的距离来确定其类别。对于USPS数据集,我们可以使用KNN算法来进行数字图像的分类。 具体实施KNN算法的步骤如下: 1. 准备数据集:将USPS数据集划分为训练集和测试集,其中训练集用于构建模型,测试集用于评估模型的性能。 2. 计算距离:对于测试集中的每个样本,计算它与训练集中所有样本的距离。常用的距离度量方法有欧氏距离、曼哈顿距离等。 3. 选择K值:选择一个适当的K值,即邻居的数量。K值的选择对算法的性能和准确率有影响。 4. 对距离进行排序:将测试样本与训练样本的距离进行排序,找到距离最近的K个样本。 5. 进行投票:根据K个最近邻样本的类别,进行投票来确定测试样本的类别。通常采用多数表决法,即选择票数最多的类别作为预测结果。 6. 评估模型:使用测试集对模型进行评估,计算分类的准确率。 通过使用KNN算法,我们可以利用USPS数据集来进行手写数字的分类,从而实现自动化的识别和分类任务。同时,通过对K值的选择,我们可以调整算法的性能和准确率,使其更加适应实际应用需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CtrlZ1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值