←上一篇 | ↓↑ | 下一篇→ |
---|---|---|
2.15 Python 中的广播 | 回到目录 | 2.17 Jupyter/iPython 笔记本的快速指南 |
关于 Python Numpy 的说明 (A Note on Python/Numpy Vectors)
本节主要讲Python中的numpy一维数组的特性,以及与行向量或列向量的区别。并介绍了老师在实际应用中的一些小技巧,去避免在coding中由于这些特性而导致的bug。
Python的特性允许你使用广播(broadcasting)功能,这是Python的numpy程序语言库中最灵活的地方。而我认为这是程序语言的优点,也是缺点。优点的原因在于它们创造出语言的表达性,Python语言巨大的灵活性使得你仅仅通过一行代码就能做很多事情。但是这也是缺点,由于广播巨大的灵活性,有时候你对于广播的特点以及广播的工作原理这些细节不熟悉的话,你可能会产生很细微或者看起来很奇怪的bug。例如,如果你将一个列向量添加到一个行向量中,你会以为它报出维度不匹配或类型错误之类的错误,但是实际上你会得到一个行向量和列向量的求和。
在Python的这些奇怪的影响之中,其实是有一个内在的逻辑关系的。但是如果对Python不熟悉的话,我就曾经见过的一些学生非常生硬、非常艰难地去寻找bug。所以我在这里想做的就是分享给你们一些技巧,这些技巧对我非常有用,它们能消除或者简化我的代码中所有看起来很奇怪的bug。同时我也希望通过这些技巧,你也能更容易地写没有bug的Python和numpy代码。
为了演示Python-numpy的一个容易被忽略的效果,特别是怎样在Python-numpy中构造向量,让我来做一个快速示范。首先设置 a=np.random.randn(5)
,这样会生成存储在数组
a
a
a 中的5个高斯随机数变量。之后输出
a
a
a ,从屏幕上可以得知,此时
a
a
a 的shape(形状)是一个
(
5
,
)
(5,)
(5,) 的结构。这在Python中被称作一个一维数组。它既不是一个行向量也不是一个列向量,这也导致它有一些不是很直观的效果。举个例子,如果我输出一个转置阵,最终结果它会和
a
a
a 看起来一样,所以
a
a
a 和
a
a
a 的转置阵最终结果看起来一样。而如果我输出
a
a
a 和
a
a
a 的转置阵的内积,你可能会想:
a
a
a 乘以
a
a
a 的转置返回给你的可能会是一个矩阵。但是如果我这样做,你只会得到一个数。
所以我建议当你编写神经网络时,不要在它的shape是 ( 5 , ) (5,) (5,) 还是 ( n , ) (n,) (n,) 或者一维数组时使用数据结构。相反,如果你设置 a a a 为 ( 5 , 1 ) (5,1) (5,1) ,那么这就将置于5行1列向量中。在先前的操作里 a a a 和 a a a 的转置看起来一样,而现在这样的 a a a 变成一个新的 a a a 的转置,并且它是一个行向量。请注意一个细微的差别,在这种数据结构中,当我们输出 a a a 的转置时有两对方括号,而之前只有一对方括号,所以这就是1行5列的矩阵和一维数组的差别。
如果你输出 a a a 和 a a a 的转置的乘积,然后会返回给你一个向量的外积,是吧?所以这两个向量的外积返回给你的是一个矩阵。
就我们刚才看到的,再进一步说明。首先我们刚刚运行的命令是这个 (a=np.random.randn(5))
,而且它生成了一个数据结构
(
a
.
s
h
a
p
e
)
(a.shape)
(a.shape) ,
a
.
s
h
a
p
e
a.shape
a.shape 是
(
5
,
)
(5,)
(5,) ,一个有趣的东西。这被称作
a
a
a 的一维数组,同时这也是一个非常有趣的数据结构。它不像行向量和列向量那样表现的很一致,这也让它的一些影响不那么明显。所以我建议,当你在编程练习或者在执行逻辑回归和神经网络时,你不需要使用这些一维数组。
相反,如果你每次创建一个数组,你都得让它成为一个列向量,产生一个 ( 5 , 1 ) (5,1) (5,1) 向量或者你让它成为一个行向量,那么你的向量的行为可能会更容易被理解。所以在这种情况下, a . s h a p e a.shape a.shape 等同于 ( 5 , 1 ) (5,1) (5,1) 。这种表现很像 a a a ,但是实际上却是一个列向量。同时这也是为什么当它是一个列向量的时候,你能认为这是矩阵 ( 5 , 1 ) (5,1) (5,1) ;同时这里 a . s h a p e a.shape a.shape 将要变成 ( 1 , 5 ) (1,5) (1,5) ,这就像行向量一样。所以当你需要一个向量时,我会说用这个或那个(column vector or row vector),但绝不会是一维数组。
我写代码时还有一件经常做的事,那就是如果我不完全确定一个向量的维度(dimension),我经常会扔进一个断言语句(assertion statement)。像这样,去确保在这种情况下是一个 ( 5 , 1 ) (5,1) (5,1) 向量,或者说是一个列向量。这些断言语句实际上是要去执行的,并且它们也会有助于为你的代码提供信息。所以不论你要做什么,不要犹豫直接插入断言语句。如果你不小心以一维数组来执行,你也能够重新改变数组维数 a = r e s h a p e a=reshape a=reshape ,表明一个 ( 5 , 1 ) (5,1) (5,1) 数组或者一个 ( 1 , 5 ) (1,5) (1,5) 数组,以致于它表现更像列向量或行向量。
我有时候看见学生因为一维数组不直观的影响,难以定位bug而告终。通过在原先的代码里清除一维数组,我的代码变得更加简洁。而且实际上就我在代码中表现的事情而言,我从来不使用一维数组。因此,要去简化你的代码,而且不要使用一维数组。总是使用 n ∗ 1 n*1 n∗1 维矩阵(基本上是列向量),或者 1 ∗ n 1*n 1∗n 维矩阵(基本上是行向量),这样你可以减少很多assert语句来节省核矩阵和数组的维数的时间。另外,为了确保你的矩阵或向量所需要的维数时,不要羞于 reshape 操作。
总之,我希望这些建议能帮助你解决一个Python中的bug,从而使你更容易地完成练习。
课程PPT
←上一篇 | ↓↑ | 下一篇→ |
---|---|---|
2.15 Python 中的广播 | 回到目录 | 2.17 Jupyter/iPython 笔记本的快速指南 |