1.初识NumPy
Numpy 是 Python 中一个非常重要的库,用于进行多维数组和矩阵的运算。它提供了丰富的 API 函数,可以对数据进行高效的维护和管理操作。
Numpy 中的数组和矩阵可以看作是一组数据的容器,你可以使用索引来访问和操作数组或矩阵中的元素。此外,Numpy 还提供了各种数学运算和数据处理函数,例如加减乘除、求和、求平均值、排序、查找等,可以帮助你快速完成各种数据分析和处理任务
2.安装NumPy
1.使用 pip
包管理器安装 NumPy
。pip
是 Python 的包管理工具,可以方便地安装第三方库。在终端或命令提示符中运行以下命令来安装 NumPy
:
pip install numpy
2.安装过程可能需要一些时间,具体时间取决于你的网络连接和安装速度。
3.安装完成后,你可以在 Python 脚本中导入 NumPy
库并使用它。在 Python 交互式环境或脚本中运行以下代码来验证安装是否成功:
import numpy as np
如果没有出现错误提示,表示安装成功。
现在,你已经成功安装了 NumPy
库,可以开始使用它进行多维数组和矩阵的运算了。
注意:在安装 NumPy
之前,确保你已经安装了 Python,并将 pip
包管理器与 Python 环境关联起来。如果没有安装 Python 或 pip
,请先安装它们。
3.NumPy矩阵的基本操作
1.创建矩阵:你可以从原始的 Python 二维数组创建矩阵。
import numpy as np
array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
matrix = np.matrix(array)
print(matrix)
2.获取元素:你可以使用索引来获取矩阵中的元素。
matrix = np.matrix([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(matrix[0, 1]) # 返回第一行第二列的元素
print(matrix[1:3, :]) # 返回第二行到第三行的所有列
print(matrix[::2, 0]) # 返回从第一行到第二行的第一列里的所有元素
3.数据转换:你可以使用 transpose()
方法来进行数据转换。
matrix = np.matrix([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(matrix.transpose()) # 将矩阵的行变为列,列变为行
4.统计计算:你可以使用 sum()
、mean()
、std()
等方法来进行统计计算。
matrix = np.matrix([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(matrix.sum(axis=0))
print(matrix.mean(axis=1))
4.NumPy常用统计分析函数
NumPy算术函数包含简单的加、减、乘、除运算,如add()函数、sum()函数、multiply()函数和divide()函数。要注意的是,数组必须具有相同形式的形状或符合数组广播规则。
1.数学运算函数:
sin()
函数:计算数组中每个元素的正弦值。
import numpy as np
arr = np.array([0.2, 0.3, 0.4, 0.5, 0.6])
sin_values = np.sin(arr)
print(sin_values)
cos()
函数:计算数组中每个元素的余弦值。
import numpy as np
arr = np.array([0.2, 0.3, 0.4, 0.5, 0.6])
cos_values = np.cos(arr)
print(cos_values)
还有tan()
函数:计算数组中每个元素的正切值;exp()
函数:计算数组中每个元素的指数值;og()
函数:计算数组中每个元素的自然对数等函数运算。
2.统计分析函数
统计分析函数是对整个NumPy数组或某条轴的数据进行统计计算。
求和sum()函数:用来计算数组中所有元素的和。
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
total_sum = np.sum(arr)
print(total_sum)
求平均值mean()函数:对数组元素求平均值、对数组元素按行求平均值和按列求平均值。
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
average = np.mean(arr)
print(average)
5.熟悉掌握NumPy模块的好处
1.效率提升:NumPy
为 Python 提供了一个强大的多维数组对象和一系列用于操作数组的函数,使得处理大型数据集和执行数值计算更加高效和便捷。
2.代码简洁:使用 NumPy
可以大大简化代码,减少循环和手动计算的工作量。它提供了很多高级函数,能够在一行代码中完成复杂的计算操作。
3.性能优势:NumPy
底层使用了向量化和并行化技术,能够利用 CPU 或 GPU 的硬件特性进行加速,从而在处理大规模数据时表现出优异的性能。
4.数据处理能力:NumPy
使得对数组进行切片、聚合、排序、过滤等操作变得非常容易,提供了丰富的数据处理功能。
5.可视化支持:结合其他数据可视化库(如 matplotlib
),NumPy
可以用于数据可视化,帮助我们更好地理解和呈现数据。