数据分析之Numpy学习笔记(二)(对象、方法、参数)
np.nan 等同于 NaN(Not a Number)
np.where根据条件判断赋值
根据一个数组生成一个新的数组
根据cond条件,如果为真写入真值,如果为假,写入假值。
pandas和numpy中的where很容易搞不清,这里附上传送门,到最下面看where总结
np.where(condition,true_value,false_value)
统计方法
arr.mean(axis=1) 算术平均值,可加axis参数
arr.std() 标准差
var 方差
...
累加、累乘、求和(计数)、绝对值等等。
arr.cumsum() 累加,可以添加axis参数
arr.cumprod() 累乘,可以添加axis参数
arr.sum() 求和,当然也可以当计数用,如:(arr>0).sum()
np.abs() 绝对值
sqrt
...
any() all()判断是否为True
any() 测试数组中是否存在一个或多个True
all() 检查数组中所有值是否全部为True
上述也都适用于非布尔型数组,所有非0元素会被当做True
sort()排序
arr.sort() 会修改数组本身
np.sort() 返回一个已排序的副本
去重
np.unique(x) 唯一化,去重,返回有序结果
集合
np.in1d(x,y) 用于测试一个数组的值在另一个数组中的成员资格,返回bool
np.intersect1d(x,y) 公共元素,返回有序结果
np.union1d(x,y) 并集,返回有序结果
np.setdiff1d(x,y) 集合的差
np.setxor1d(x,y) 对称差
sign(),正数改为1,负数改为-1,0为0
np.sign()
数组的文件输入输出(内置二进制格式篇)、保存
np.save('保存的文件名',arr) -->未压缩文件
np.load('文件名.npy') -->未压缩文件
np.savez('文件名.npz',a=arr1,b=arr2) -->未压缩文件
-->通过load加载时,会得到一个类似字典的对象
-->array({'a':arr1,'b':arr2})
压缩数据--> np.savez_compressed('文件名.npz',a=arr1,b=arr2)
,
,
下一篇:数据分析之Numpy学习笔记(三)(线性代数)