02.numpy

Numpy

Python的一种开源数据计算扩展。可用来存储和处理大型矩阵,比Python自身的嵌套列表结构高效的多。一种重要特征是其数组计算。
与列表不同,数组中要求所有元素的dtype是一样的,若传入参数的类型与数组类型不一样,需要按照已有的类型进行转换。

产生数组

从列表产生

l = [0, 1, 2, 3]
a = np.array(l)

从列表传入

a = np.array([1, 2, 3, 4])

生成全0数组

a = np.zeros(5) #默认都是浮点数

生成全1数组

a = np.ones(5, dtype=‘int’) # 默认都是浮点数,可以使用dtype指定类型’int’, ‘bool’…

使用fill方法将数组设为指定值

a = np.array([1, 2, 3, 4])
a.fill(5) # 将数组中每个元素变为5
a = a.astype(‘float’) # 通过astype转换数组类型
a.fill(2.5)

生成整数序列

a = np.arange(1, 10) # 生成一个左闭右开的整数序列
a = np.arange(1, 10, 2) # 指定步长

生成等差数列

a = np.linspace(_start, _end, _num) # 生成一个从_start到_end,一共_num个数的等差数列

生成随机数

a = np.random.rand(_num) #生成_num个0到1的随机数
a = np.random.randn(_num) #生成_num个0到1符合正态分布的随机数
a = np.random.randint(_start, _end, _num) #生成_num个[_start, _end)区间的整数

数组属性

查看类型

type(a) # 查看数组类型
a.dtype # 查看数组中类型
a.shape # 查看形状,返回一个元组,每个元素代表这一维的元素数目
np.shape(a)
a.size() # 查看里面元素的数目
a.ndim # 查看数组的维度

索引与切片

a = np.array([0, 1, 2, 3])
a[0] = 10 #支持直接修改
a = np.array([11, 12, 13, 14, 15])
a[1: 3],a[1: -2],a[-4: 3] # array([12 13]) #切片,支持负索引

省略参数

a[-2:] # 14 15
a[::2] # 11 13 15

多维数组及其属性

a = np.array([
[0, 1, 2, 3],
[10, 11, 12, 13]
])
a.shape # (2, 4)
a.size # 8
a.ndim # 2

多维数组索引

a[1,3] # 13
a[1,3] = -1 # 支持直接赋值
a[1] # [10, 11, 12, -1]
a[:, 1] # [1, 11]

多维数组切片

a = np.array([
[0,1,2,3,4,5],
[10,11,12,13,14,15],
[20,21,22,23,24,25],
[30,31,32,33,34,35],
[40,41,42,43,44,45],
[50,51,52,53,54,55],
]
a[0,3:5] # [3,4]
a[-2:, -2:] #最后两行的最后两列
a[:, 2] #得到第3列
a[2::2, ::2] # 第3,5行的奇数列

数组中切片是引用机制, 在列表中没有

复制

a = np.array([0,1,2,3,4])
b = a[2:4].copy()

花式索引

一维花式索引

a = np.arange(0, 100, 10) # 0, 10, 20, 30, 40, 50, 60, 70, 80, 90
index = [1,2,-3]
y = a[index]
print(y) # 10 20 70
mask = np.array([0,1,1,0,0,1,0,0,1,0],dtype=bool) # 长度必须与数组长度相等且必须是布尔数组
a[mask] # 10, 20, 50, 80

二维花式索引

对于二维花式索引需要给定行和列的值
与切片不同,花式索引返回的是元对象的一个复制而不是引用。

a = np.array([
[0,1,2,3,4,5],
[10,11,12,13,14,15],
[20,21,22,23,24,25],
[30,31,32,33,34,35],
[40,41,42,43,44,45],
[50,51,52,53,54,55],
]
a[(0,1,2,3,4), (1,2,3,4,5)] # 返回此对角线上的5个值
a[3:, [0,2,4]] # 最后三行的第1,3,5列
mask = np.array([1,0,1,0,0,1],dtype=bool)
a[mask,2] # 2,22,52

“不完全”索引

只给定行索引的时候,返回整行:

y = [:3]
con = np.array([0,1,1,0,1,0],dtype=bool)
a[con]

where语句

a = np.array([0, 12, 5, 20])
a > 10# 返回对应位置bool类型的数组
np.where(a>10),返回int64类型的下标数组
a[a>10] #直接使用数组操作

asarray函数

原地改变数组类型

a = np.array([1,2,3])
np.asarray(a, dtype=float)

astype函数

没有改变数组类型,返回一个新的

a = np.array([1,2,3])
a.astype(float)

数组排序

sort函数

a = np.sort(mv_num) 返回一个新的

argsort函数

order = np.argsort(mv_num)返回从小到大的排序在数组中的索引位置

其他

求和

np.sum(mv_num)

最大值

np.max(mv_length)

最小值

np.min(mv_score) mv_score.min()

均值

np.mean(mv_length) mv_length.mean()

标准差

np.std(mv_length) mv_length.std()

协方差矩阵

np.cov(mv_score,mv_length)

多维数组操作

数组形状

a = np.arange(6)
a.shape = 2, 3
a = a.reshape(2, 3) # 返回新的
a.T #转置
a = a.transpose() # 转置,返回新的
print(a.shape)

数据连接

concatenate((a0,a1,...,aN), axis=0)

x = np.array([
[0,1,2],
[10,11,12]
])
y = np.array([
[50,51,52],
[60,61,62]
])
z=np.concatenate((x, y))
[[0,1,2],[10,11,12],[50,51,52],[60,61,62]]
z=np.concatenate((x,y),axis=1)
[[0,1,2,50,51,52],[10,11,12,60,61,62]]
z=np.array((x, y))
[[[0,1,2],[10,11,12]],[[50,51,52],[60,61,62]]]

vstack函数

np.vstack((x, y))纵向堆叠

hstack函数

np.hstack((x, y))横向堆叠

dstack函数

np.dstack((x,y))

内置函数

np.abs(a)
np.exp(a)
np.median(a)
np.cumsum(a) …

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

倾海、

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值