读取下载到本地的EMNIST数据集中的Letters数据集

        读取自己从官网上下载的数据集Letters。在读取Letters数据集前先了解一下什么是Letters?其实很简单就是一个包涵了a-z和A-Z的手写体数据集总共52个字母,这个数据集将52个字母分成了26类,也就是说大小写归为一类了,即a和A属于同一类。

        在了解完Letters数据集后就是导入数据集了。首先,需要将下载好的压缩包进行解压

Letters数据集:

  链接:https://pan.baidu.com/s/1Uq82VExaCJ7Z94cwdX_VRw  提取码: f8vp

 解压之后得到四个文件:

1、emnist-letters-test-images-idx3-ubyte.gz        训练集

2、emnist-letters-test-labels-idx1-ubyte.gz         训练集标签

3、emnist-letters-train-images-idx3-ubyte.gz        测试集

4、emnist-letters-train-labels-idx1-ubyte.gz        测试集标签

然后将以上4个压缩文件解压得到对应的Idx文件

之后把解压好的文件和test.py文件放在同一目录下 

 在导入数据前先检查一下是否有“idx2numpy”这个第三方库,如果没有就需要Win+R打开运行框输入cmd

进入命令提示符,进入Python安装的路径(作者Python的安装路径是:C:\Python37) 后接着进入Scripts之后输入:pip install idx2numpy进行安装。

 安装完成后就可以用idx2numpy导入Letters数据集的数据了:  

import idx2numpy
#导入训练集和训练集标签
X_train = idx2numpy.convert_from_file('./emnist-letters-train-images-idx3-ubyte')
y_train = idx2numpy.convert_from_file('./emnist-letters-train-labels-idx1-ubyte')
#导入测试集和测试集标签
X_test = idx2numpy.convert_from_file('./emnist-letters-test-images-idx3-ubyte')
y_test = idx2numpy.convert_from_file('./emnist-letters-test-labels-idx1-ubyte')

  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值