import numpy as np
numpy数据类型
#创建时申明数据类型
arr1 = np.array([1,2,3],dtype=np.float64)
#查看数据类型
arr1.dtype
dtype('float64')
#转换数据类型 原数据类型不改变
arr2 = arr1.astype(np.int64)
arr2.dtype
dtype('int64')
#引用另一个数组的数据类型
arr3 = np.array([1.0,2.0,3.0])
arr3 = arr3.astype(arr2.dtype)
arr3.dtype
dtype('int64')
索引与切片
切片不是复制,改变数据,元数据也改变
arr = np.arange(10)
arr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
#按索引获取第五个数 从0开始记
arr[4]
4
#获取后两个数
arr[-2:]
array([8, 9])
#按索引获取第5,6,7,个数
arr[5:8]
array([5, 6, 7])
冒号 : 的解释:如果只放置一个参数,如 [2],将返回与该索引相对应的单个元素。如果为 [2:],表示从该索引开始以后的所有项都将被提取。
如果使用了两个参数,如 [2:7],那么则提取两个索引(不包括停止索引)之间的项。
arr2 = np.array([[1,2,3],[4,5,6],[7,8,9]])
arr2
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
#获取第二行
arr2[1]
array([4, 5, 6])
#获取第二列
arr2[:,1]
array([2, 5, 8])
#获取第二行第二列的元素
arr2[1,1]
5
#获取第二行到第三行,第二列到第三列的元素
arr2[1:,1:]
array([[5, 6],
[8, 9]])
布尔索引
arr2 > 5
array([[False, False, False],
[False, False, True],
[ True, True, True]])
arr2[arr2> 5]
array([6, 7, 8, 9])
还可使用 == != & | 等
转置与换轴
arr = np.arange(15)
arr
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
#换轴
arr.reshape((3,5))
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
#转置
arr1.T
array([[ 0, 5, 10],
[ 1, 6, 11],
[ 2, 7, 12],
[ 3, 8, 13],
[ 4, 9, 14]])
#第一列成第一行,第一行成第一列
arr1.transpose((0,1))
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
常用函数
arr
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
#求平方根 还有函数abs(求绝对值),square(平方)等
np.sqrt(arr)
array([0. , 1. , 1.41421356, 1.73205081, 2. ,
2.23606798, 2.44948974, 2.64575131, 2.82842712, 3. ,
3.16227766, 3.31662479, 3.46410162, 3.60555128, 3.74165739])
#判断是否有空元素
np.isnan(arr)
array([False, False, False, False, False, False, False, False, False,
False, False, False, False, False, False])
arr.sum()
arr.mean()
arr.std()
4.320493798938574
#指定列或行
arr = arr.reshape((3,5))
arr.mean(axis=0)#计算每一列的平均值
arr.std(axis=1)#计算每一列的标准差
array([1.41421356, 1.41421356, 1.41421356])
bools = arr > 5
bools.any()#检查数组是否至少有一个为Ture
bools.all()#检查数组是否全部为True
False
#排序 返回对原数组的拷贝
arr.sort()#可指定按哪个轴 axis=0/1或某一轴
arr
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
#去重
np.unique(arr)
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
#判断5,6元素是否在数组arr中
np.in1d(arr,[5,6])
array([False, False, False, False, False, True, True, False, False,
False, False, False, False, False, False])
#保存数组及读取数组
np.save('file_name',arr)
np.load('file_name.npy')
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])