Python 科学计算：利用 NumPy 加速数值运算

把海弄干的鱼.

于 2024-05-18 09:01:22 发布

阅读量1.8k

点赞数 51

文章标签： python numpy

本文链接：https://blog.csdn.net/YPY15947274155/article/details/139016925

版权

Python 科学计算：利用 NumPy 加速数值运算

1. 引言

浩瀚的宇宙、复杂的流体、金融市场的波动，这些现象都蕴藏着海量的数据和复杂的规律。为了探索这些奥秘，科学家和工程师们需要借助计算机进行模拟、分析和预测。Python，以其简洁易懂的语法和丰富的第三方库，成为了科学计算领域的一把利器。然而，作为解释型语言，Python 本身执行效率的局限性，尤其在处理大规模数值运算时，性能可能成为瓶颈。

NumPy (Numerical Python) 应运而生，成为了 Python 科学计算的基石。它提供了高性能的多维数组对象 (ndarray) 和丰富的函数，能够显著提升数值运算速度。有了 NumPy，Python 就像插上了翅膀，可以更高效地处理海量数据，探索科学世界的奥秘。

2. NumPy 数组：高性能计算的基础

NumPy 数组 (ndarray) 是 Python 高性能计算的基础。与 Python 内置的列表不同，NumPy 数组具有以下特点：

同质性: 数组中所有元素必须是相同的数据类型，例如整数、浮点数等。这种数据类型的统一性简化了数据存储，避免了类型检查的开销，并为向量化操作创造了条件。
多维性: NumPy 数组可以表示向量、矩阵、多维张量等数据结构，为科学计算提供了灵活的数据表示形式，能够更自然地表达科学计算中的各种问题。
高效的存储: NumPy 数组将数据存储在连续的内存块中，有利于 CPU 快速访问和处理数据，减少内存访问时间，从而提升运算速度。

2.1 NumPy 数组的创建

NumPy 提供了多种创建数组的方法，方便用户根据不同的需求生成数组：

从列表或元组创建数组: np.array() 函数可以将 Python 列表或元组转换为 NumPy 数组。

import numpy as np

# 从列表创建数组
a = np.array([1, 2, 3, 4])
print(f"a: {a}")

# 从元组创建数组
b = np.array((5, 6, 7, 8))
print(f"b: {b}")

使用 NumPy 函数创建特定类型的数组: NumPy 提供了许多函数用于创建特定类型的数组，例如：
- np.zeros(): 创建全零数组
- np.ones(): 创建全一数组
- np.arange(): 创建等差数列
- np.linspace(): 创建等间距数列
- np.random.rand(): 创建均匀分布的随机数数组
- np.random.randn(): 创建标准正态分布的随机数数组

import numpy as np

# 创建全零数组
a = np.zeros(5)
print(f"a: {a}")

# 创建全一数组
b = np.ones((2, 3))
print(f"b: \n{b}")

# 创建等差数列
c = np.arange(1, 10, 2)
print(f"c: {c}")

# 创建等间距数列
d = np.linspace(0, 1, 5)
print(f"d: {d}")

# 创建均匀分布的随机数数组
e = np.random.rand(3, 4)
print(f"e: \n{e}")

# 创建标准正态分布的随机数数组
f = np.random.randn(2, 2)
print(f"f: \n{f}")

2.2 NumPy 数组的属性

NumPy 数组拥有丰富的属性，可以帮助我们了解数组的特征：

shape: 数组的维度，例如 (2, 3) 表示 2 行 3 列的矩阵。
dtype: 数组元素的数据类型，例如 int32, float64 等。
size: 数组元素的总数。
ndim: 数组的维度数量。
itemsize: 每个数组元素的字节大小。
nbytes: 整个数组占用的字节数。

import numpy as np

a = np.array([[1, 2, 3], [4, 5, 6]])

print(f"a.shape: {a.shape}")
print(f"a.dtype: {a.dtype}")
print(f"a.size: {a.size}")
print(f"a.ndim: {a.ndim}")
print(f"a.itemsize: {a.itemsize}")
print(f"a.nbytes: {a.nbytes}")

2.3 高效存储：连续内存块与 strides 属性

NumPy 数组将数据存储在连续的内存块中，这种存储方式有利于 CPU 高效地访问和处理数据，减少内存访问时间，从而提升运算速度。

strides 属性描述了数组在内存中的布局。它是一个元组，每个元素表示在每个维度上移动一个元素所需的字节数。例如，对于一个 (2, 3) 的二维数组，如果 strides 为 (24, 8)，则表示：

在第一个维度 (行) 上移动一个元素需要 24 个字节，因为每行有 3 个元素，每个元素占 8 个字节 (float64 类型)。
在第二个维度 (列) 上移动一个元素需要 8 个字节，因为每个元素占 8 个字节。

理解 strides 属性可以帮助我们更好地理解 NumPy 数组的内存布局，从而编写更高效的代码。

import numpy as np

a = np.array([[1, 2, 3], [4, 5, 6]], dtype=np.float64)

print(f"a.strides: {a.strides}")

3. 向量化操作：加速数值运算的关键

向量化操作是 NumPy 高性能计算的核心。其本质是批量运算，即对整个数组进行操作，而不是逐个元素循环处理。向量化操作避免了 Python 循环的低效性，充分利用了 CPU 的并行处理能力，例如 SIMD (Single Instruction Multiple Data) 指令集，同时对多个数据进行运算，大幅提升计算速度。

3.1 向量化操作的优势

简洁的代码: 向量化操作通常只需一行代码，比传统 Python 循环更易读易写，例如 c = a + b 就可以完成两个数组的对应元素相加。
高效的执行: NumPy 底层利用 CPU 并行处理能力，例如 SIMD (Single Instruction Multiple Data) 指令集，同时对多个数据进行运算，大幅提升计算速度。

3.2 丰富的向量化操作类型

NumPy 提供了丰富的向量化操作，涵盖了科学计算中常用的各种运算：

算术运算: 加减乘除、幂运算、三角函数、指数函数、对数函数等。

import numpy as np

a = np.array([1, 2, 3, 4])
b = np.array([5, 6, 7, 8])

# 加法
c = a + b
print(f"a + b = {c}")

# 减法
c = a - b
print(f"a - b = {c}")

# 乘法
c = a * b
print(f"a * b = {c}")

# 除法
c = a / b
print(f"a / b = {c}")

# 幂运算
c = a ** 2
print(f"a ** 2 = {c}")

# 三角函数
c = np.sin(a)
print(f"sin(a) = {c}")

# 指数函数
c = np.exp(a)
print(f"exp(a) = {c}")

# 对数函数
c = np.log(a)
print(f"log(a) = {c}")

逻辑运算: 比较运算、逻辑运算 (与、或、非)、掩码操作等。

import numpy as np

a = np.array([1, 2, 3, 4])
b = np.array([2, 2, 4, 4])

# 比较运算
c = a > b
print(f"a > b = {c}")

# 逻辑运算
c = (a > b) & (a < 4)
print(f" (a > b) & (a < 4) = {c}")

# 掩码操作
c = a[a > b]
print(f"a[a > b] = {c}")

统计运算: 求和、平均值、方差、标准差、最大值、最小值、中位数、百分位数等。

import numpy as np

a = np.array([1, 2, 3, 4])

# 求和
sum_a = np.sum(a)
print(f"sum(a) = {sum_a}")

# 平均值
mean_a = np.mean(a)
print(f"mean(a) = {mean_a}")

# 方差
var_a = np.var(a)
print(f"var(a) = {var_a}")

# 标准差
std_a = np.std(a)
print(f"std(a) = {std_a}")

# 最大值
max_a = np.max(a)
print(f"max(a) = {max_a}")

# 最小值
min_a = np.min(a)
print(f"min(a) = {min_a}")

线性代数运算: 矩阵乘法、矩阵求逆、行列式、特征值分解等。

import numpy as np

a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

# 矩阵乘法
c = np.dot(a, b)
print(f"a . b = \n{c}")

# 矩阵求逆
c = np.linalg.inv(a)
print(f"inv(a) = \n{c}")

# 行列式
c = np.linalg.det(a)
print(f"det(a) = {c}")

随机数生成: np.random 模块提供了各种随机数生成函数，例如均匀分布、正态分布、泊松分布等。

import numpy as np

# 均匀分布
a = np.random.rand(3, 4)
print(f"均匀分布随机数: \n{a}")

# 标准正态分布
b = np.random.randn(2, 2)
print(f"标准正态分布随机数: \n{b}")

3.3 向量化操作性能对比

为了更直观地展示向量化操作带来的性能提升，我们可以使用 %timeit 魔法函数对比向量化操作与 Python 循环的性能差异：

import numpy as np

a = np.random.rand(1000000)

# 向量化操作
%timeit np.sum(a)

# Python 循环
def sum_loop(x):
    sum = 0
    for i in x:
        sum += i
    return sum

%timeit sum_loop(a)

运行结果会显示向量化操作的执行时间远小于 Python 循环，证明了向量化操作在数值运算上的显著优势。

4. 广播机制：灵活处理不同形状的数组

NumPy 的广播机制允许对形状不同的数组进行运算。当两个数组形状不同时，NumPy 会自动扩展较小数组的维度，使其与较大数组匹配，从而实现运算。

广播机制的优势：

简化代码，避免手动调整数组形状，提高代码可读性。

4.1 广播机制的规则

NumPy 广播机制遵循以下规则：

维度匹配: 从后往前比较两个数组的维度，如果维度兼容，则可以进行广播。维度兼容是指：
- 两个维度相等。
- 其中一个维度为 1。
维度扩展: 如果两个数组的维度不相等，则会将较小数组的维度扩展为与较大数组相同。扩展维度时，会复制数组元素，使其与较大数组对应。

4.2 广播机制的应用

以下是一些广播机制的例子：

将标量与数组进行运算

import numpy as np

a = np.array([1, 2, 3, 4])
b = 2
c = a * b
print(f"a * b = {c}")

在这个例子中，标量 b 被广播为与 a 形状相同的数组 [2, 2, 2, 2]，然后进行对应元素相乘。

将向量与矩阵进行运算

import numpy as np

a = np.array([1, 2, 3])
b = np.array([[1, 2, 3],
              [4, 5, 6]])
c = a + b
print(f"a + b = \n{c}")

在这个例子中，向量 a 被广播为与 b 形状相同的矩阵 [[1, 2, 3], [1, 2, 3]]，然后进行对应元素相加。

将不同维度数组进行运算

import numpy as np

a = np.array([1, 2, 3])
b = np.array([[1],
              [2]])
c = a + b
print(f"a + b = \n{c}")

在这个例子中，a 的维度被扩展为 (1, 3)，b 的维度被扩展为 (2, 3)，然后进行对应元素相加。

4.3 广播机制的局限性

广播机制虽然方便，但也存在局限性：

内存占用: 广播机制可能会导致内存占用过高，因为需要复制数组元素以进行维度扩展。
性能损失: 维度扩展操作也会带来一定的性能损失。

因此，在使用广播机制时，需要谨慎考虑内存占用和性能影响，并在必要时手动调整数组形状，避免不必要的性能损失。

5. NumPy 高级特性

除了向量化操作和广播机制，NumPy 还提供了许多高级特性，方便用户进行更复杂的数据操作。

5.1 数组索引和切片

NumPy 数组支持类似 Python 列表的索引和切片操作，可以灵活地访问和修改数组元素。

import numpy as np

a = np.array([1, 2, 3, 4, 5])

# 访问元素
print(f"a[0]: {a[0]}")
print(f"a[2]: {a[2]}")

# 切片
print(f"a[1:4]: {a[1:4]}")
print(f"a[::2]: {a[::2]}")

# 多维数组索引和切片
b = np.array([[1, 2, 3], [4, 5, 6]])
print(f"b[0, 1]: {b[0, 1]}")
print(f"b[:, 1]: {b[:, 1]}")
print(f"b[1, :]: {b[1, :]}")

5.2 数组变形

NumPy 提供了多种函数用于改变数组的形状，例如：

reshape(): 将数组变形为新的形状，元素数量必须保持不变。
transpose(): 转置数组，交换数组的维度。
ravel(): 将多维数组展平成一维数组。

import numpy as np

a = np.array([1, 2, 3, 4, 5, 6])

# reshape
b = a.reshape((2, 3))
print(f"b: \n{b}")

# transpose
c = b.transpose()
print(f"c: \n{c}")

# ravel
d = b.ravel()
print(f"d: {d}")

5.3 数组合并和分割

NumPy 提供了多种函数用于将多个数组合并成一个数组，以及将一个数组分割成多个数组，例如：

concatenate(): 沿着指定轴连接数组。
stack(): 沿着新的轴堆叠数组。
split(): 将数组分割成多个子数组。
hsplit(): 水平分割数组。
vsplit(): 垂直分割数组。

import numpy as np

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

# concatenate
c = np.concatenate((a, b))
print(f"c: {c}")

# stack
d = np.stack((a, b), axis=0)
print(f"d: \n{d}")

# split
e = np.split(c, 2)
print(f"e: {e}")

# hsplit
f = np.hsplit(b.reshape((2, 3)), 3)
print(f"f: {f}")