这篇文章讨论了安装 NumPy,然后创建、读取和排序 NumPy 数组。
NumPy(即 Numerical Python)是一个库,它使得在 Python 中对线性数列和矩阵进行统计和集合操作变得容易。我在 Python 数据类型的笔记中介绍过,它比 Python 的列表快几个数量级。NumPy 在数据分析和科学计算中使用得相当频繁。
我将介绍安装 NumPy,然后创建、读取和排序 NumPy 数组。NumPy 数组也被称为 ndarray,即 N 维数组的缩写。
安装 NumPy
使用 pip
安装 NumPy 包非常简单,可以像安装其他软件包一样进行安装:
pip install numpy
安装了 NumPy 包后,只需将其导入你的 Python 文件中:
import numpy as np
将 numpy
以 np
之名导入是一个标准的惯例,但你可以不使用 np
,而是使用你想要的任何其他别名。
为什么使用 NumPy? 因为它比 Python 列表要快好几个数量级
当涉及到处理大量的数值时,NumPy 比普通的 Python 列表快几个数量级。为了看看它到底有多快,我首先测量在普通 Python 列表上进行 min()
和 max()
操作的时间。
我将首先创建一个具有 999,999,999 项的 Python 列表:
>>> my_list = range(1, 1000000000)
>>> len(my_list)
999999999
现在我将测量在这个列表中找到最小值的时间:
>>> start = time.time()
>>> min(my_list)
1
>>> print('Time elapsed in milliseconds: ' + str((time.time() - start) * 1000))
Time elapsed in milliseconds: 27007.00879096985
这花了大约 27,007 毫秒,也就是大约 27 秒。这是个很长的时间。现在我试着找出寻找最大值的时间:
>>> start = time.time()
>>> max(my_list)
999999999
>>> print('Time elapsed in milliseconds: ' + str((time.time() - start) * 1000))
Time elapsed in milliseconds: 28111.071348190308
这花了大约 28,111 毫秒,也就是大约 28 秒。
现在我试试用 NumPy 找到最小值和最大值的时间:
>>> my_list =