2.16 关于 Python Numpy 的说明-深度学习-Stanford吴恩达教授

最新推荐文章于 2024-05-31 22:58:28 发布

Zhao-Jichao

最新推荐文章于 2024-05-31 22:58:28 发布

阅读量3.7k

点赞数 7

分类专栏：深度学习DL 文章标签：深度学习机器学习神经网络人工智能算法

本文链接：https://blog.csdn.net/weixin_36815313/article/details/105328406

版权

深度学习DL 专栏收录该内容

206 篇文章 2732 订阅

订阅专栏

←上一篇	↓↑	下一篇→
2.15 Python 中的广播	回到目录	2.17 Jupyter/iPython 笔记本的快速指南

关于 Python Numpy 的说明 (A Note on Python/Numpy Vectors)

本节主要讲Python中的numpy一维数组的特性，以及与行向量或列向量的区别。并介绍了老师在实际应用中的一些小技巧，去避免在coding中由于这些特性而导致的bug。

Python的特性允许你使用广播（broadcasting）功能，这是Python的numpy程序语言库中最灵活的地方。而我认为这是程序语言的优点，也是缺点。优点的原因在于它们创造出语言的表达性，Python语言巨大的灵活性使得你仅仅通过一行代码就能做很多事情。但是这也是缺点，由于广播巨大的灵活性，有时候你对于广播的特点以及广播的工作原理这些细节不熟悉的话，你可能会产生很细微或者看起来很奇怪的bug。例如，如果你将一个列向量添加到一个行向量中，你会以为它报出维度不匹配或类型错误之类的错误，但是实际上你会得到一个行向量和列向量的求和。

在Python的这些奇怪的影响之中，其实是有一个内在的逻辑关系的。但是如果对Python不熟悉的话，我就曾经见过的一些学生非常生硬、非常艰难地去寻找bug。所以我在这里想做的就是分享给你们一些技巧，这些技巧对我非常有用，它们能消除或者简化我的代码中所有看起来很奇怪的bug。同时我也希望通过这些技巧，你也能更容易地写没有bug的Python和numpy代码。

为了演示Python-numpy的一个容易被忽略的效果，特别是怎样在Python-numpy中构造向量，让我来做一个快速示范。首先设置 a=np.random.randn(5) ，这样会生成存储在数组 $a$ 中的5个高斯随机数变量。之后输出 $a$ ，从屏幕上可以得知，此时 $a$ 的shape（形状）是一个 $(5,)$ 的结构。这在Python中被称作一个一维数组。它既不是一个行向量也不是一个列向量，这也导致它有一些不是很直观的效果。举个例子，如果我输出一个转置阵，最终结果它会和 $a$ 看起来一样，所以 $a$ 和 $a$ 的转置阵最终结果看起来一样。而如果我输出 $a$ 和 $a$ 的转置阵的内积，你可能会想： $a$ 乘以 $a$ 的转置返回给你的可能会是一个矩阵。但是如果我这样做，你只会得到一个数。

在这里插入图片描述

所以我建议当你编写神经网络时，不要在它的shape是 $(5,)$ 还是 $(n,)$ 或者一维数组时使用数据结构。相反，如果你设置 $a$ 为 $(5, 1)$ ，那么这就将置于5行1列向量中。在先前的操作里 $a$ 和 $a$ 的转置看起来一样，而现在这样的 $a$ 变成一个新的 $a$ 的转置，并且它是一个行向量。请注意一个细微的差别，在这种数据结构中，当我们输出 $a$ 的转置时有两对方括号，而之前只有一对方括号，所以这就是1行5列的矩阵和一维数组的差别。

在这里插入图片描述

如果你输出 $a$ 和 $a$ 的转置的乘积，然后会返回给你一个向量的外积，是吧？所以这两个向量的外积返回给你的是一个矩阵。

在这里插入图片描述

就我们刚才看到的，再进一步说明。首先我们刚刚运行的命令是这个 (a=np.random.randn(5)) ，而且它生成了一个数据结构 $(a . s h a p e)$ ， $a . s h a p e$ 是 $(5,)$ ，一个有趣的东西。这被称作 $a$ 的一维数组，同时这也是一个非常有趣的数据结构。它不像行向量和列向量那样表现的很一致，这也让它的一些影响不那么明显。所以我建议，当你在编程练习或者在执行逻辑回归和神经网络时，你不需要使用这些一维数组。

在这里插入图片描述

相反，如果你每次创建一个数组，你都得让它成为一个列向量，产生一个 $(5, 1)$ 向量或者你让它成为一个行向量，那么你的向量的行为可能会更容易被理解。所以在这种情况下， $a . s h a p e$ 等同于 $(5, 1)$ 。这种表现很像 $a$ ，但是实际上却是一个列向量。同时这也是为什么当它是一个列向量的时候，你能认为这是矩阵 $(5, 1)$ ；同时这里 $a . s h a p e$ 将要变成 $(1, 5)$ ，这就像行向量一样。所以当你需要一个向量时，我会说用这个或那个(column vector or row vector)，但绝不会是一维数组。

在这里插入图片描述

我写代码时还有一件经常做的事，那就是如果我不完全确定一个向量的维度(dimension)，我经常会扔进一个断言语句(assertion statement)。像这样，去确保在这种情况下是一个 $(5, 1)$ 向量，或者说是一个列向量。这些断言语句实际上是要去执行的，并且它们也会有助于为你的代码提供信息。所以不论你要做什么，不要犹豫直接插入断言语句。如果你不小心以一维数组来执行，你也能够重新改变数组维数 $a = r e s h a p e$ ，表明一个 $(5, 1)$ 数组或者一个 $(1, 5)$ 数组，以致于它表现更像列向量或行向量。

在这里插入图片描述

我有时候看见学生因为一维数组不直观的影响，难以定位bug而告终。通过在原先的代码里清除一维数组，我的代码变得更加简洁。而且实际上就我在代码中表现的事情而言，我从来不使用一维数组。因此，要去简化你的代码，而且不要使用一维数组。总是使用 $n * 1$ 维矩阵（基本上是列向量），或者 $1 * n$ 维矩阵（基本上是行向量），这样你可以减少很多assert语句来节省核矩阵和数组的维数的时间。另外，为了确保你的矩阵或向量所需要的维数时，不要羞于 reshape 操作。