NumPy数组的基本用法
ndarray是一个通用的同构数据多维容器,也就是说,其中的所有元素必须是相同类型的。每个数组都有一个shape(一个表示各维度大小的元组)和一个dtype(一个用于说明数组数据类型的对象)
创建ndarray
创建数组最简单的办法就是使用array函数。它接受一切序列型的对象(包括其他数组),然后产生一个新的含有传入数据的NumPy数组
data1 = [6, 7.5, 8, 0, 1]
arr1 = np.array(data1)
arr1
# array([ 6. , 7.5, 8. , 0. , 1. ])
嵌套序列(比如由一组等长列表组成的列表)将会被转换为一个多维数组:
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
arr2
# array([[1, 2, 3, 4],
# [5, 6, 7, 8]])
# 数组的维度
arr2.ndim
# 2
arr2.shape
# (2, 4)
除非特别说明,np.array会尝试为新建的这个数组推断出一个较为合适的数 据类型。数据类型保存在一个特殊的dtype对象中。比如说,在上面的两个例子中:
arr1.dtype
# dtype('float64')
arr2.dtype
# dtype('int64')
除np.array之外,还有一些函数也可以新建数组。比如,zeros和ones分别可以创建指定长度或形 状的全0或全1数组。empty可以创建一个没有任何具体值的数组。要用这些方法创建多维数组,只 需传入一个表示形状的元组即可:
np.zeros(10)
np.zeros((3, 6))
np.empty((2, 3, 2))
注意 empty并不是全返回0,有时候是一些未初始化的垃圾值
由于NumPy关注的是数值计算,因此,如果没有特别指定,数据类型基本都是float64(浮点数)
数组创建函数:
ndarray的数据类型
dtype(数据类型)是一个特殊的对象,它含有ndarray将一块内存解释为特定数据类型所需的信息:
arr1 = np.array([1, 2, 3], dtype=np.float64)
arr2 = np.array([1, 2, 3], dtype=np.int32)
arr1.dtype
arr2.dtype
NumPy的数据类型
可以通过ndarray的astype方法明确地将一个数组从一个dtype转换成另一个dtype:
arr = np.array([1, 2, 3, 4, 5])
arr.dtype
float_arr = arr.astype(np.float64)
float_arr.dtype
基本的索引和切片
NumPy数组的索引是一个内容丰富的主题,因为选取数据子集或单个元素的方式有很多。一维数 组很简单。从表面上看,它们跟Python列表的功能差不多:
arr = np.arange(10)
arr
arr[5]
arr[5:8]
arr[5:8] = 12
arr
值得注意的是,数组切片是原始数组的视图。这意味着数据不会被复制,视图上的任何修改都会直接反映到源数组上,也就是说任何对数据的直接切片,都不是重新创建一个新的数据
如果你想要得到的是ndarray切片的一份副本而非视图,就需要明确地进行复制操作 例如
arr[5:8].copy
对于多维数组,可以传入一个以逗号隔开的索引列表来选取单个元素:
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 两种方法等价
arr2d[0][2]
arr2d[0, 2]
在多维数组中,如果省略了后面的索引,则返回对象会是一个维度低一点的ndarray(它含有高一级维度上的所有数据)因此,在2×2×3数组arr3d中:
arr3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
arr3d
#array([[[ 1, 2, 3],
# [ 4, 5, 6]],
#
# [[ 7, 8, 9],
# [10, 11, 12]]])
arr3d[0]
# array([[1, 2, 3],
# [4, 5, 6]])
arr3d[0]是一个2×3数组