一、Numpy读/写
1、读/写二进制文件
np.load("文件名.npy") : 从二进制的文件中读取数据
np.save("文件名[.npy]",arr) :以二进制的格式保存数据
2、读/写文本文件
①np.loadtxt("../tmp/arr.txt",delimiter=",") #把文件加载到一个二维数组中
②np.savetxt("../tmp/arr.txt",arr,fmt="%d",delimiter=",") #保存为整数,以逗号分隔
3、读取CSV文件
loadtxt(fname,dtype=,comments="#",delimiter=None,converters=None,skiprows=0,
usecols = None ,unpack = Flase,ndmin =0 , encoding="bytes")
主要参数说明
参数 | 说明 |
fname | str,读取的CSV文件名 |
delimiter | str,数据的分隔符 |
usecols | tuple(元组),执行加载数据文件中的哪些列 |
unpack | bool,是否将加载的数据拆分成多组,Ture表示拆 |
skiprows | int,跳过多少行,一般用于跳过前几行的描述性文字 |
encoding | bytes,编码格式 |
二、Numpy中的数据统计与分析
1、常用统计函数
函数名 | 说明 |
---|---|
np.sum | 所有元素的和 |
np.prod | 所有元素的乘积 |
np.cumsum | 元素的累积加和 |
np.cumprod | 元素的累积乘积 |
np.min | 最小值 |
np.max | 最大值 |
np.percentile | 0-100百分位数 |
np.quantile | 0-1分位数 |
np.median | 中位数 |
np.average | 加权平均,参数可以指定weights |
np.mean | 平均值 |
np.std | 标准差 |
np.var | 方差 |
2、Numpy的axis参数的用途
axis=0代表行、axis=1代表列
对于sum/mean/media等聚合函数:
- 理解1:axis=0代表把行消解掉,axis=1代表把列消解掉
- 理解2:axis=0代表跨行计算,axis=1代表跨列计算