python-数据分析与展示（Numpy、matplotlib、pandas）---1

最新推荐文章于 2023-09-29 12:10:13 发布

郭凭海

最新推荐文章于 2023-09-29 12:10:13 发布

阅读量775

点赞数

分类专栏： python基础学习

本文链接：https://blog.csdn.net/qq_41726877/article/details/83003886

版权

python基础学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

笔记内容整理自mooc上北京理工大学嵩天老师python系列课程数据分析与展示，本人小白一枚，如有不对，多加指正

1.ndarray对象的属性

.ndim、.shape、.size(元素个数，不是占用内存大小）、.dtype、.itemsize

2.创建ndarray数组的方式

2.1一共有三种np.ndarray（）、函数创建法、字节流创建

2.2主要记录一下常用的函数创建ndarray的方法np.arange(n) np.ones(shape) np.zeros(shape) up.full(shape,val) np.eye(n)(n*n单位矩阵，对角线是1，其宇是0）

shape是元组类型，val是数字，ones、zeros、eye默认的元素类型是浮点型，但是可以指定为整形，dtype = int32

2.3np.ones_like(a)、np.zeros_like(a)、np.eye_like(a)生成和a同shape的n维数组

2.4np.linspace()、np.concatenate()、np.logspace()生成ndarray，space注意与np.arange()区分，可以用endpoint=true/false来调整结束点，且默认是浮点数。np库生成的ndarray默认绝大多数都是浮点数，除了np.arange();

2.5ndarray数组的维度变换.reshape(shape) .resize(shape) .swapaxes(ax1,ax2) .flatten(),区别前两个，前者新生成数组，不改变原数组，后者反之，改变原数组，reshape改变形状，但是要保证数组的总的元素个数没有变换，否则改变不了形状（2,3,4）->(3,8)

2.6 .astype(new_type) 此方法创建新数组，但是数据类型会发生变化

2.7 a.tolist()

3.ndarray数组的操作-----索引和切片

3.1 一维数组的索引和切片 a[1:4:2]，起始编号：终止编号（不包含）：步长，跟space区分，后者一般是包含终止编号的，且第三个参数是个数

3.2多维数组索引a[1,2,3] 切片a[ : , 1, 3] a[ :, 1:3, : ] a[ :, : , ::2 ] ,其实就是每个维度和一维数组切片方式相同

4.ndarray数组的运算

4.1 a.mean()求平均值，a +/-/*//标量都是作用于数组的每一个元素

4.2 NumPy中元素级一元运算函数 np.abs(x) np.fabs(x) np.sqrt(x) np.square(x) np.log(x) np.log10(x) np.log2(x) np.ceil(x) np.floor(x) np.rint(x) np.modf(x) np.cos(x) np.cosh(x) np.exp(x) np.sign(x)等，注意a本身不变而是生成新的数组

4.3 NumPy中元素级二元运算函数np.maximum(x,y) np.fmax() np.minimum(x,y) np.fmin() np.mod(x,y) np.copysign(x,y) <>= == != <= >=

5.numpy数据存取

5.1 np.savetxt(frame, array, fmt='%.18e',delimiter=None) 参数依次为文件（可以是.gz或.bz2压缩文件），存入数组，每个数据元素的格式%d，%.2f，%.18e默认是最后，18位小数科学计数法，delimiter是分隔符，csv文件为“，” 例子np.savetxt(‘a.csv’, a, fmt=‘%d’, delimiter=‘,’)

5.2 np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False) 参数为文件（可以是.gz或.bz2压缩文件），

5.3多维数组的文件存取（前两个特指二维数组）a.tofile（frame,seq='',format='%s'） np.fromfile(frame, dtype=float, count=-1,sep='')sep如果是空串，则为二进制文件

5.4多维数据文件存取，要求numpy的文件格式.npy为拓展名 np.save(fname,attay)/np.load(fname)

6.numpy的随机数函数（numpy的random子库）

6.1np.random.rand(x1,x2,x3...), np.random.randn(x1,x2,...)正态分布 np.random.randint(low,high,shape) np.random.seed(s)

6.2随机库的高级函数 shuffle(a) 根据数组a的第一轴进行随机排列，改变数组a, permutation(a) 根据数组a的第一轴进行随机排列，不改变数组a, choice(a[,size,replace,p])

6.3 np.random.uniform(low,high,size)产生具有均匀分布的数组，size为形状，np.random.normal(loc,scale,size)正态分布数组，loc为均值，scale标准差，size形状，np.random.poisson(lam,size)泊松分布

7.numpy的统计函数

7.1 sum(a,axis=None)、mean(a,axis=None)、average(a,axis=None,weights=None)、std(a,axis=None)、var(a,axis=None),mean是期望（即加权平均值），std是标准差，var是方差，axis是轴，即第几维度，从0开始。如果限制在第几维度做运算，就是其他维度相同，这一维度索引不同的元素之间相互运算而得结果

7.2 np.min(a) np.argmin(a)计算数组a中元素的最小值的降一维后的下标，对应有max版本 np.unravel_index(index,shape)根据shape将一维下表index转换成多维下标 np.ptp(a)计算数组中元素最大值和最小值的差 np.median(a)计算数组a中元素的中位数

8.numpy的梯度函数

8.1np.gradient(f) 计算数组f中元素的梯度，当f为多维是，返回每个维度的梯度n维数组返回n个数组，2维数组返回2个数组