1、.npz文件的内容是怎样的,怎么打开?
因为以npz结尾的数据集是压缩文件,里面还有其他的文件。
使用:cat_data.files 命令进行查看
import numpy as np
cat_data = np.load('cat.npz')
dog_data = np.load('dog.npz')
可以看出,cat_data.npz数据集中有:x_test,y_train,y_test,x_train 这四个数据集.
接下来,进去数据集的读取:
查看x_train数据集:
加载.npz文件时,出现错误:OSError: Failed to interpret file ‘xxx.npz’ as a pickle
首先了解pickle的定义:
pickle: 用于python特有的类型和python的数据类型间进行转换
pickle提供四个功能:dumps,dump,loads,load
pickle可以存储所有python支持的原生类型(bool,int,float,string,byte,none等),由任何原生类型组成的列表、元组、字典和集合,函数、类、类的实例。
所以这个报错本质就是数据文件不一致,numpy的loadtxt()和load()的区别.
loadtxt()和load()的区别:
load( ) 代表用Numpy专用的二进制格式保存数据,它们会自动处理元素类型和形状等信息。一般load读取的是.npy或者.npz的文件。
loadtxt( ) 主要是用来读取txt等文件的。
以下是loadtxt()的一般用法,最普通的就是loadtxt(“文件名.txt”)
numpy.loadtxt(fname, dtype=, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)
报错原因是因为用load()直接读取txt文件导致读取不到。改用loadtxt()即可。
np.loadtxt( )官方文档: https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html
loadtxt()函数里的参数应该设置什么,参考官方文档里的说明。