学习了数据分析,基本上是要掌握三个库,分别是numpy,pandas,matplotlib,本篇文章主要讲了numpy的基础。这是篇学习笔记,来源于自己的总结。所以特别基础的内容不会涵盖,可以看作是一篇对自己的知识考核和提醒。?
numpy基础
布尔索引
import numpy as np
data=np.random.randn(7,4)
data[data<0]=0
#选出了data中所有小于0的项并且置于0
神奇索引
import numpy as np
data=np.arange(32).reshape((8,4))
data[[1,5,7,2]][:,[0,3,1,2]]
#按照特定的顺序截取
数制的转换和换轴
import numpy as np
data=np.arange(15).reshape((3,5))
data.T#矩阵的转置
data.transpose((1,0.2))
#(1,0,2)本应该是(0,1,2)分别表示组、行、列,现在则表示组与行互换
data.swapaxes(1,2)
#接受一对轴编号,如例子接受了1与2(行与列)再进行互换,返回数组的视图
通用函数
判断选择
import numpy as np
np.where(cond,xarr,yarr)
#cond是一个布尔数组,当cond为True时,选xarr中的数,反之选yarr中的数
基础数组的统计方法
函数:
sum,mean,std,var,min,max,argmin,argmax,cumsum,cumprod
可选参数:
axis=0/1,以行或列为单位
排序
fangfa
import numpy as no
np.sort(axis=0/1)
数组的集合操作
方法 | 描述 |
---|---|
unique(x) | 计算x的唯一值,并排序 |
intersect1d(x,y) | 计算x和y的交集,并排序 |
union1d(x,y) | 计算x和y的并集,并排序 |
in1d(x,y) | 计算x中的元素是否包含在y中,返回一个布尔值数组 |
setdiff1d(x,y) | 差集,在x中但不在y中的x的元素 |
setxor1d(x,y) | 异或集,在x或y中,但不属于x、y交集的元素 |
线性代数
常用numpy.linalg函数
函数 | 描述 |
---|---|
diag | 将一个方阵的对角(或非对角)元素作为一维数组返回,或者将一维数组转换成一个方阵,并且在非对角线上有零点 |
dot | 矩阵点乘 |
trace | 计算对角元素和 |
det | 计算矩阵的行列式 |
eig | 计算方阵的特征值和特征向量 |
inv | 计算矩阵的逆矩阵 |
pinv | 计算矩阵的Moore-Penrose伪逆 |
qr | 计算QR分解 |
svd | 计算奇异值分解(SVD) |
solve | 求解x的线性系统Ax=b,其中A是方阵 |
lstsq | 计算Ax=b的最小二乘解 |
伪随机数的生成
numpy.random中部分函数列表
函数 | 描述 |
---|---|
seed | 向随机数生成器传递随机状态种子 |
permutation | 返回一个序列的随机排列,或者返回一个乱序的整数范围序列 |
shuffle | 随机排列一个序列 |
rand | 从均匀分布中抽取样本 |
randint | 根据给定的由低到高的范围抽取随机整数 |
randn | 从均值0方差1的正态分布中抽取样本(MATLAB型接口) |
binomial | 从二项分布中抽取样本 |
beta | 从beta分布中抽取样本 |
chisquare | 从卡方分布中抽取样本 |
gamma | 从伽马分布中抽取样本 |
normal | 从正态(高斯)分布中抽取样本 |
uniform | 从均匀[0,1)分布中抽取样本 |