NumPy用户指南（1）——NumPy简介

最新推荐文章于 2021-08-06 21:07:50 发布

mighty13

最新推荐文章于 2021-08-06 21:07:50 发布

阅读量3w

点赞数 1

分类专栏： Python数据科学文章标签： numpy 用户指南简介

本文链接：https://blog.csdn.net/mighty13/article/details/118531706

版权

Python数据科学专栏收录该内容

24 篇文章 23 订阅

订阅专栏

NumPy是Python科学计算的基础包，提供多维数组对象和高效的数学操作。它的ndarray对象支持固定大小的数组，允许快速操作。与Python列表相比，NumPy数组在处理大量数据时更高效，且代码简洁。NumPy的核心特性包括向量化和广播，使得计算过程既快速又易于理解。许多Python科学计算库依赖NumPy数组作为基础数据结构。了解并掌握NumPy的使用对于提升科学计算效率至关重要。

摘要由CSDN通过智能技术生成

此系列文章参照NumPy官方用户指南1.2.1版本进行翻译、解读（直译说不清楚的可能会加入自己的一些理解）。

`NumPy`简介

`NumPy`概述

NumPy是Python科学计算的基础包。它提供了多维数组对象及其各种派生对象（如掩码数组和矩阵），它还提供了用于数组快速操作的各种API，包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换（DFT）、基本线性代数，基本统计运算和随机模拟等。

ndarray对象是NumPy包的核心。ndarray对象封装了相同数据类型的 n 维数组，出于性能方面的考虑，ndarray许多操作都是编译之后执行的。

NumPy数组和标准Python序列之间有几个重要的区别：

NumPy数组在创建时具有固定的大小，而Python列表可以动态增长。更改ndarray对象的大小将创建一个新数组并删除原来的数组。
NumPy数组的元素都需要具有相同的数据类型，因此在内存中的大小相同。例外情况：数组元素为Python对象时（包含NumPy对象），允许作为元素的数组大小不同。
NumPy数组更便于对大量数据进行高级数学和其他类型的操作。NumPy数组与Python内置序列相比执行效率更高，且使用的代码更少。
越来越多Python科学计算和数学软件包使用NumPy数组，虽然这些工具通常都支持Python内置序列作为参数，但它们在处理之前会还是会将输入的数组转换为NumPy数组，而且输出也通常为NumPy数组。换言之，为了高效地使用当今Python科学/数学工具（大部分的科学计算工具），只知道如何使用Python内置序列是不够的，还需要知道如何使用 NumPy 数组。

序列的大小和速度在科学计算中尤为重要。例如，我们需要将1维序列中的每个元素与相同长度的另一个序列中的相应元素相乘。假设数据存储在Python 列表 a 和 b 中，通过迭代每个元素实现的概要代码如下：

c = []
for i in range(len(a)):
    c.append(a[i]*b[i])

上述代码确实符合要求，但是如果a和b都包含数百万个数字，使用Python循环的效率将非常低。我们可以通过C语言更快地完成相同任务，概要代码如下：

for (i = 0; i < rows; i++): {
  c[i] = a[i]*b[i];
}

基于C语言的示例代码的确比Python代码效率更高，但牺牲了用Python编写代码所带来的好处。

更进一步，如果数据增加了维度，假设数组为二维数组，上面的C语言代码会扩展为：

for (i = 0; i < rows; i++): {
  for (j = 0; j < columns; j++): {
    c[i][j] = a[i][j]*b[i][j];
  }
}

NumPy 提供了两全其美的解决方案：当涉及 ndarray操作时，默认进行逐元素操作，但是逐元素操作由NumPy 预编译的C代码执行。使用NumPy实现的概要代码如下：

c = a * b

既具有C代码的运行效率，又具有Python代码的简洁性！NumPy的用法更为简单。
上述代码展示了NumPy的两个特性：向量化和广播，它们也是NumPy的大部分功能的基础。

为什么 `NumPy` 这么快？

向量化说明代码中没有任何显式的循环、索引等，这当然是预编译的C代码隐式优化的结果。向量化代码有许多优点，其中包括：

向量化代码更简洁，更易于阅读
更少的代码行通常意味着更少的错误
代码更接近于标准的数学符号（通常更容易正确编码数学结构）
向量化代码更 Pythonic。如果没有向量化，代码就会充斥着低效且难以阅读的for循环。

广播是用于描述隐式逐元素操作行为的术语。通常，NumPy中的所有操作，不止算术运算，还包括逻辑运算、位运算、函数式编程等都可以通过这种隐式的逐元素方式实现。此外，在上面的示例中，a并且b可以是相同形状的多维数组，或者一个标量、一个数组，甚至两者是具有不同形状的两个数组，条件是较小的数组可以“扩展”到更大的形状，由此产生的广播是明确的。

还有谁在使用 `NumPy`？

NumPy完全支持面向对象的方法，再夸奖一次 ndarray ！
ndarray是一个类，拥有许多方法和属性。
最顶级的NumPy命名空间中的某些函数镜像了ndarray的许多方法。
PS：因此，对于同一数组操作，既可以使用ndarray对象调用某些方法，也可以使用NumPy模块调用某些函数。
程序员在编码时可选用自己喜欢的范式。这种灵活性使NumPy数组方言和NumPy ndarray 类成为Python多维数据交换的事实标准语言。

源文档

https://numpy.org/doc/stable/user/whatisnumpy.html

mighty13

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NumPy用户指南（1）——NumPy简介

此系列文章参照NumPy官方用户指南1.2.1版本进行翻译、解读（直译说不清楚的可能会加入自己的一些理解）。NumPy简介NumPy概述NumPy是Python科学计算的基础包。它提供了多维数组对象及其各种派生对象（如掩码数组和矩阵），它还提供了用于数组快速操作的各种API，包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换（DFT）、基本线性代数，基本统计运算和随机模拟等。ndarray对象是NumPy包的核心。ndarray对象封装了相同数据类型的 n 维数组，出于性能方面的考虑，n
复制链接

扫一扫