- NumPy是Numeric Python的简称
- NumPy是Python科学计算的基础工具包
- NumPy是Python数值计算扩展,专门用于处理矩阵,其运算效率比列表更高效。
查看是否安装
$ pip list | grep numpy
numpy 1.20.3
numpydoc 1.1.0
$ pip install numpy
import numpy as np
print(np.__version__)
数组
- NumPy的数据结构是n维的数组对象(ndarray),Python的list虽然也能表示但不高效,随着列表数据的增加效率会降低。
Python本身执行是慢的,因为会执行很多复杂的check功能,而调用NumPy时其实调用调用的是C语言而非Python。NumPy其实是C的逻辑,例如创建存储容器array
是会寻找内存上一连串区域来存放,而Python存放的原则是不连续的区域。这使得Python在索引容器中的数据时不会那么高效。Numpy只需要在固定的连续区域前后游走就能拿到数据。
NumPy通常不是用一个一维数组来存放数据,而是用二维或三维的块来存放,NumPy快速的矩阵相乘运算,能将乘法运算分配到计算机的多核上来并行运算来加速运算速度。
数据对象
NumPy中主要的数据对象是具有相同数据类型的多维数组,所有元素都具有相同数据类型,通过一个正整数元素索引的元素表格,通常元素是数字。
NumPy中维度(dimensions)叫做轴(axies),轴的个数称为秩(rank)。
例如:
[1, 2, 3]
3D空间中的一个点的坐标[1, 2, 3]
是一个秩为1的数组(一个维度),它只有一个轴。轴的长度为3。
例如:
[[1., 0., 0.], [0., 1., 2.]]
数组的秩为2,具有两个维度,第一个维度长度为2,第二个维度长度为3。
NumPy的数组成为ndarray
,与标准Python类库array.array
不同。
ndarray
对象属性
属性 | 描述 |
---|---|
ndarray.ndim | 数组的轴数 |
ndarray.shape | 数组的维度 |
ndarray.size | 数组元素总个数 |
ndarray.dtype | 数据中元素类型的对象 |
ndarray.itemsize | 数组中每个元素的字节大小 |
ndarray.data | 实际数组元素的缓冲区 |
例如:
from numpy import *
arr = arange(15).reshape(3, 5)
print(arr)
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]
print(arr.ndim) # 2
print(arr.shape) # (3, 5)
print(arr.dtype.name) # int32
print(arr.itemsize) # 4
print(arr.size) # 15
print(type(arr)) # <class 'numpy.ndarray'>
创建数组
使用NumPy中的array
函数将系统自带的列表list
转换成为NumPy中的数组,嵌套列表会被转换为多维数组(矩阵)。
import numpy as np
lst = [[1, 3, 5], [2, 4, 6]]
arr = np.array(lst)
array([
[1, 3, 5],
[2, 4, 6]
])
NumPy中array
数组内部的元素必须为相同类型,可使用dtype
指令查看类型。
import numpy as np
lst = [[1, 3, 5], [2, 4, 6]]
arr = np.array(lst)
arr.dtype
dtype('int32')
通常数组元素开始都是未知的,但大小已知。因此NumPy使用占位符创建数组的函数。
函数 | 描述 |
---|---|
zeros() | 创建元素全是0的数组 |
ones() | 创建元素全是1的数组 |
empty() | 创建内容随机且以来内存状态的数组 |
例如:
from numpy import *
print( zeros( (3,4) ) )
print( ones( (2,3,4), dtype=int16 ) )
print( empty( (2,3) ) )
创建数列
- NumPy提供了类似
arange
函数用于返回数组而非列表
from numpy import *
arange( 10, 30, 5 )
array([10, 15, 20, 25])
数组计算
- 数组计算无需循环即可批量运算
import numpy as np
lst = [[1, 3, 5], [2, 4, 6]]
arr = np.array(lst)
print(arr)
print(arr + 1)
print(arr - 1)
print(arr * 2)
print(arr * arr)
[[1 3 5]
[2 4 6]]
[[2 4 6]
[3 5 7]]
[[0 2 4]
[1 3 5]]
[[ 2 6 10]
[ 4 8 12]]
[[ 1 9 25]
[ 4 16 36]]
数组赋值
- 数组索引和列表相同,可通过方括号
[]
和数字选择,也可直接赋值。
import numpy as np
lst = [[1, 3, 5], [2, 4, 6]]
arr = np.array(lst)
print(arr[1])
print(arr[1][1])
print(arr[-1:])
arr[0] = [10, 30, 50]
print(arr[0])
[2 4 6]
4
[[2 4 6]]
[10 30 50]