numpy基本入门操作汇总二

本文是学习《利用python进行数据分析》的部分笔记,在这里感谢作者。

九:数学和统计方法:

sum,mean,std等函数,既可以作为数组的事例方法调用,也可以当做顶级Numpy函数调用:

 

arr=np.random.randn(5,4)
>>> arr.mean()
0.30723226701582096
>>> np.mean(arr)
0.30723226701582096

mean和sum这类函数可以接受一个axis参数,指定取行或列的数据

 

 

>>> arr.mean(axis=1)
array([-0.27960398, -0.14470685,  0.77773957,  0.26493607,  0.91779653])
>>> arr.sum(0)
array([-0.51563296,  4.58151412,  0.80550744,  1.27325674])
>>> arr
array([[-1.75497273,  0.50527593, -0.02333152,  0.15461239],
       [-0.06705213, -0.01714475, -0.60111944,  0.10648892],
       [ 0.71210024,  2.29201725, -1.04229547,  1.14913626],
       [-0.45675796,  0.80788751,  1.97804801, -1.26943327],
       [ 1.05104962,  0.99347819,  0.49420587,  1.13245243]])

基本的数组统计方法还有以下一些:

 

var       方差

min/max     最小值、最大值

argmin/argmax      最大和最小元素的索引

cumsum        所有元素的累计和

cumprod       所有元素的累计积


十:用于布尔型数组的方法

 

在上面的方法中,布尔值会被强制转换成0或1,因此,sum常用于对布尔型数组中的True计数

arr = np.random.randn(100)
>>> (arr>0).sum()
49

any用于测试数组中是否存在一个或者多个true

all用于测试数组中是否都是True

 

>>> bools=np.array([False,False,False,True,True])
>>> bools.any()
True
>>> bools.all()
False

这两个方法也可以用于非布尔型数组,所有非0元素将会被当做True。

 

 

十一:排序

 

用sort函数

 

>>> arr=randn(8)
>>> arr
array([-0.05716577,  0.39176583, -0.16355803, -0.75749158, -0.05858426,
        0.27394639,  2.15453362,  0.03001597])>> >

arr.sort()
>>> arr
array([-0.75749158, -0.16355803, -0.05858426, -0.05716577,  0.03001597,
        0.27394639,  0.39176583,  2.15453362])

多维数组可以在任何一个轴向上进行排序,只需要将轴序号传给sort即可

 

 

>>> >>> arr=randn(5,3)
>>> arr
array([[ -2.23973954e+00,  -4.51064672e-01,   1.22831533e-01],
       [ -5.20488365e-01,  -6.04060242e-01,   4.17827196e-01],
       [  1.31605261e+00,   4.49926583e-01,  -5.02536669e-01],
       [  5.51459340e-01,   3.02275944e-01,   5.01922045e-04],
       [ -5.81123339e-01,   1.38517518e+00,   3.73132478e-01]])>> >

arr.sort(1)
>>> arr
array([[ -2.23973954e+00,  -4.51064672e-01,   1.22831533e-01],
       [ -6.04060242e-01,  -5.20488365e-01,   4.17827196e-01],
       [ -5.02536669e-01,   4.49926583e-01,   1.31605261e+00],
       [  5.01922045e-04,   3.02275944e-01,   5.51459340e-01],
       [ -5.81123339e-01,   3.73132478e-01,   1.38517518e+00]])

顶级方法np.sort返回的是数组的已排序副本,而就地排序则会修改数组本身。

 

 

十二:唯一化

 

np.unique,用于找出数组中的唯一值并返回已排序的结果。

 

>>> names=np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe'])
>>> np.unique(names)
array(['Bob', 'Joe', 'Will'], 

 

 

十三:用于数组的文件输入输出

 

1,将数组以二进制格式保存到磁盘

np.save和np.load时读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。

 

>>> arr=np.arange(10)
>>> np.save('some_array',arr)

如果文件路径末尾没有扩展名.npy,则该扩展名会被自动加上,然后就可以通过np.load读取磁盘上的文件。

 

 

>>> np.load('some_array.npy')
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

通过np.savez可以将多个数组保存在一个压缩文件中,将数组以关键字参数的形式传入即可:

 

 

np.savez('array_archive.npz',a=arr,b=arr)

加载npz文件时,会得到一个类似字典的对象,该对象会对各个数组进行延迟加载

 

>>> arch=np.load('array_archive.npz')
>>> arch
<numpy.lib.npyio.NpzFile object at 0x00000000059C8F98>
>>> arch['b']
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

2.存取文本文件

 

>>> arr=np.loadtxt('ex1data1.txt',delimiter=',')

np.savetxt执行的是相反的操作,将数组写到以某种分隔符隔开的文本文件中。
 

十四:线性代数:

 

1,矩阵乘法:

>>> x=np.array([[1.,2.,3.],[4.,5.,6.]])
>>> y=np.array([[6.,23.],[-1,7],[8,9]])
>>> x
array([[ 1.,  2.,  3.],
       [ 4.,  5.,  6.]])>> >

y
array([[  6.,  23.],
       [ -1.,   7.],
       [  8.,   9.]])>> >

x.dot(y)
array([[  28.,   64.],
       [  67.,  181.]])

numpy.linalg中有一组标准的矩阵分解运算以及诸如求逆和行列式之类的东西。

 

from numpy.linalg import inv,qr
>>> X=randn(5,5)
>>> mat=X.T.dot(X)
>>> inv(mat)
array([[ 0.75420692, -0.25274918, -0.29049394, -0.26562136,  0.09284846],
       [-0.25274918,  3.03250359,  1.0858041 ,  0.75130694,  2.76777681],
       [-0.29049394,  1.0858041 ,  0.68926702,  0.33203335,  0.94595721],
       [-0.26562136,  0.75130694,  0.33203335,  0.37381694,  0.55013175],
       [ 0.09284846,  2.76777681,  0.94595721,  0.55013175,  3.20477824]])>> >

mat.dot(inv(mat))
array([[  1.00000000e+00,  -4.44089210e-16,   1.11022302e-16,
         -5.55111512e-17,   0.00000000e+00],
       [  5.55111512e-17,   1.00000000e+00,  -2.22044605e-16,
          2.22044605e-16,  -8.88178420e-16],
       [  6.93889390e-17,  -4.44089210e-16,   1.00000000e+00,
         -2.77555756e-17,  -2.22044605e-16],
       [ -1.38777878e-16,  -1.33226763e-15,  -2.22044605e-16,
          1.00000000e+00,   4.44089210e-16],
       [  2.77555756e-17,   8.88178420e-16,   2.22044605e-16,
          0.00000000e+00,   1.00000000e+00]])

 

 

十五:随机数生成

部分numpy.random函数

seed        确定随机数生成的种子

rand         产生均匀分布的样本值

randint    从给定的上下限范围内随机选取整数

randn      产生标准正态分布的样本值

binomial  产生二项分布的样本值

normal   产生正态分布的样本值

beta       产生beta分布的样本值

 

 




 


 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
NumPy是Python中用于科学计算的一个重要库,它提供了高性能的多维数组对象和各种数学函数,是许多数据分析和科学计算任务的基础。在NumPy中,维数组是最常用的数据结构之一,可以进行各种基本操作。 以下是NumPy维数组的基本操作: 1. 创建维数组: - 使用`numpy.array()`函数创建维数组。 - 使用`numpy.zeros()`或`numpy.ones()`函数创建全零或全一的维数组。 - 使用`numpy.random.rand()`或`numpy.random.randn()`函数创建随机值的维数组。 2. 访问元素: - 使用索引访问维数组中的元素,索引从0开始。 - 可以使用切片操作获取维数组的子数组。 3. 数组形状: - 使用`numpy.shape`属性获取维数组的形状,返回一个元组表示行数和列数。 - 使用`numpy.reshape()`函数改变维数组的形状。 4. 数组操作: - 使用`numpy.transpose()`函数进行转置操作,交换行和列。 - 使用`numpy.concatenate()`函数进行数组的拼接操作。 - 使用`numpy.split()`函数进行数组的分割操作。 5. 数组运算: - 支持基本的数学运算,如加法、减法、乘法和除法。 - 可以使用`numpy.dot()`函数进行矩阵乘法运算。 - 可以使用`numpy.sum()`、`numpy.mean()`等函数计算数组的和、平均值等。 6. 数组迭代: - 可以使用`for`循环迭代维数组的每个元素。 - 可以使用`numpy.nditer()`函数进行更灵活的迭代操作

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值