import numpy as np
一、创建数组
data = np.array([1,2,3,4,5,6])
data
array([1, 2, 3, 4, 5, 6])
type(data)
numpy.ndarray
data = np.array([[1,2,3],[4,5,6],[7,8,9]])
data
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
data = np.arange(0,20,2)
data
array([ 0, 2, 4, 6, 8, 10, 12, 14, 16, 18])
data = np.linspace(1,10,10)
data
array([ 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.])
data = np.linspace(1,10,10,endpoint=False)
data
array([1. , 1.9, 2.8, 3.7, 4.6, 5.5, 6.4, 7.3, 8.2, 9.1])
data = np.zeros(10)
data
array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
data = np.zeros([4,5])
data
array([[0., 0., 0., 0., 0.],
[0., 0., 0., 0., 0.],
[0., 0., 0., 0., 0.],
[0., 0., 0., 0., 0.]])
data = np.zeros([4,5],dtype=int)
data
array([[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0]])
data = np.ones(10)
data
array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
data = np.ones([4,5])
data
array([[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.]])
data = np.ones([4,5],dtype=int)
data
array([[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1]])
# 单位矩阵 3*3
np.eye(3)
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
#创建对角矩阵,对角元素是3,4
np.diag([3,4])
array([[3, 0],
[0, 4]])
# 三行四列都为8
data = np.full((3,4),8)
data
array([[8, 8, 8, 8],
[8, 8, 8, 8],
[8, 8, 8, 8]])
data = np.random.randint(2, size=10)
data
array([0, 1, 0, 1, 1, 1, 0, 1, 0, 0])
data = np.random.randint(12,size=(3,4))
data
array([[ 2, 11, 9, 4],
[11, 1, 8, 2],
[11, 8, 4, 1]])
二、数组属性
# 返回int,表示数组的维度
data.ndim
2
# 返回几行几列
data.shape
(3, 4)
# 返回元素个数
data.size
12
# 返回元素类型
data.dtype
dtype('int32')
data * 4
array([[ 8, 44, 36, 16],
[44, 4, 32, 8],
[44, 32, 16, 4]])
data + 2
array([[ 4, 13, 11, 6],
[13, 3, 10, 4],
[13, 10, 6, 3]])
data - 1
array([[ 1, 10, 8, 3],
[10, 0, 7, 1],
[10, 7, 3, 0]])
data / 2
array([[1. , 5.5, 4.5, 2. ],
[5.5, 0.5, 4. , 1. ],
[5.5, 4. , 2. , 0.5]])
三、数组访问
data = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]])
data
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12],
[13, 14, 15, 16],
[17, 18, 19, 20]])
# 取第一行
data[0]
array([1, 2, 3, 4])
# 取最后一行
data[-1]
array([17, 18, 19, 20])
# 取第一列
data[:,0]
array([ 1, 5, 9, 13, 17])
# 取最后一列
data[:,-1]
array([ 4, 8, 12, 16, 20])
# 取某一位置,如第三行第三列
data[2,2]
11
# 取某一位置,如第三行第三列
data[2][2]
11
# 取特定行
data[0:3]
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
data[::-1]
array([[17, 18, 19, 20],
[13, 14, 15, 16],
[ 9, 10, 11, 12],
[ 5, 6, 7, 8],
[ 1, 2, 3, 4]])
# 转置
data.T
array([[ 1, 5, 9, 13, 17],
[ 2, 6, 10, 14, 18],
[ 3, 7, 11, 15, 19],
[ 4, 8, 12, 16, 20]])
四、数组高级索引
data
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12],
[13, 14, 15, 16],
[17, 18, 19, 20]])
data[[3,2],[0,1]]
array([13, 10])
data[[1,2],[1,2]]
array([ 6, 11])
data[[1,-1],[0,1]]
array([ 5, 18])
data[[0,-1]][:,[0,1,3]]
array([[ 1, 2, 4],
[17, 18, 20]])
data[np.ix_([0,-1],[0,1,3])]
array([[ 1, 2, 4],
[17, 18, 20]])
五、数组形状改变
data
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12],
[13, 14, 15, 16],
[17, 18, 19, 20]])
data.size
20
data.shape
(5, 4)
# 将数组改成想要的维度
data = data.reshape(4,5)
data
array([[ 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10],
[11, 12, 13, 14, 15],
[16, 17, 18, 19, 20]])
data.shape
(4, 5)
data = data.reshape(1,20)
data
array([[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20]])
data.shape
(1, 20)
# 将多维数组展开为一维数组
data.flatten()
array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,
18, 19, 20])
# 将一维数组转换为二维数组
arr1 = np.array([1,2,3])
arr2 = np.array(['3','2','1'])
np.vstack((arr1,arr2))
array([['1', '2', '3'],
['3', '2', '1']], dtype='<U11')
# 将多个数组,组合成一个更大的数组
np.hstack((arr1,arr2))
array(['1', '2', '3', '3', '2', '1'], dtype='<U11')
arr1 = np.array([[1,2,3],[4,5,6]])
arr2 = np.array([[7,8,9],[10,11,12]])
# concatenate用于合并数组,0代表纵向,1代表横向
np.concatenate((arr1,arr2),axis=0)
array([[ 1, 2, 3],
[ 4, 5, 6],
[ 7, 8, 9],
[10, 11, 12]])
np.concatenate((arr1,arr2),axis=1)
array([[ 1, 2, 3, 7, 8, 9],
[ 4, 5, 6, 10, 11, 12]])
六、数组广播机制
- 一维数组,广播运算时,按照行补齐方式,当行数不一致时,首先补齐行数,然后进行运算
- 二维数组,广播运算时,当列数不一致时,首先补齐列数,然后进行运算,当行数不一致时,首先补齐行数,然后进行运算
七、数组的排序、搜索
data = np.array([1,4,5,3,4,2514,5123,5,6])
# 从小到大排序
data = np.sort(data)
data
array([ 1, 3, 4, 4, 5, 5, 6, 2514, 5123])
data = np.array([9,4,6,1,4,34,23,14,6])
# 返回数据从小到大的索引值
data = np.argsort(data)
data
array([3, 1, 4, 2, 8, 0, 7, 6, 5], dtype=int64)
# 返回的是数组中最小值对应的索引位置
np.argmin(data)
5
# 返回的是数组中最大值对应的索引位置
np.argmax(data)
4
# 满足条件(condition),输出x,不满足输出y
np.where(data>4,True,False)
array([False, False, False, False, True, False, True, True, True])
# 返回满足条件的元素值
np.extract(data>4,data)
array([8, 7, 6, 5], dtype=int64)
八、字符串处理
九、统计计算
data = np.array([[1,2,3],[4,5,6],[7,8,9]])
data
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
# 对行进行求和
data.sum(axis=1)
array([ 6, 15, 24])
# 对列进行求和
data.sum(axis=0)
array([12, 15, 18])
# 对行进行计算均值
data.mean(axis=1)
array([2., 5., 8.])
# 对列进行计算均值
data.mean(axis=0)
array([4., 5., 6.])
# 累计求和
data.cumsum()
array([ 1, 3, 6, 10, 15, 21, 28, 36, 45], dtype=int32)
# 计算一个多维数组的任意百分比分位数
np.percentile(data,[0,25,50,75,100])
array([1., 3., 5., 7., 9.])