[AI 笔记] Numpy

最新推荐文章于 2024-10-06 22:57:34 发布

mark__tuwen

最新推荐文章于 2024-10-06 22:57:34 发布

阅读量193

点赞数 1

分类专栏： AI 笔记文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/mark__tuwen/article/details/106413935

版权

AI 笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

[AI 笔记] Numpy

数组arrays
创建数组方法
访问数组
整型数组访问
布尔型数组访问
数据类型
数组计算
sum函数
T转置
广播Broadcasting

参考资料：

CS231n课程笔记翻译：Python Numpy教程

数组arrays

每个Numpy数组都是数据类型相同的元素组成的网格

import numpy as np

a = np.array([[1,2,3],[4,5,6]])
print(type(a))
print(a.shape)          
print(a)
print(a[0])
print(a[1,1])

<class 'numpy.ndarray'>
(2, 3)
[[1 2 3]
 [4 5 6]]
[1 2 3]
5

创建数组方法

import numpy as np

a = np.zeros((2,2))      #全零数组
print(a)

b = np.ones((2,2))       #全1数组
print(b)

c = np.full((2,2), 7)    #全指定常数数组
print(c)

d = np.eye(2)            #指定维度单位矩阵
print(d)

e = np.random.random((2,2))  #随机数组
print(e)

[[0. 0.]
 [0. 0.]]
[[1. 1.]
 [1. 1.]]
[[7 7]
 [7 7]]
[[1. 0.]
 [0. 1.]]
[[0.74992187 0.36602064]
 [0.33322249 0.95573549]]

访问数组

import numpy as np

a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
b = a[:2, 1:3]        #切片操作
print(a)
print(b)

print(a[0, 1])
b[0,0] = 55            #共享内存
print(a[0, 1])
a[0, 1] = 2

row1 = a[0, :]         #第一行
row2 = a[0:1, :]       #体会不同
print(row1)
print(row2)

column1 = a[:, 1]      #第二列
column2 = a[:, 1:2]    #体会不同
print(column1)
print(column2)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
[[2 3]
 [6 7]]
2
55
[1 2 3 4]
[[1 2 3 4]]
[ 2  6 10]
[[ 2]
 [ 6]
 [10]]

整型数组访问

import numpy as np

a = np.array([[1,2], [3, 4], [5, 6]])
print(a[[0, 1, 2], [0, 1, 0]])                 #对应位置组成索引
print(np.array([a[0, 0], a[1, 1], a[2, 0]]))   #两者等效

[1 4 5]
[1 4 5]

布尔型数组访问

import numpy as np

a = np.array([[1,2], [3, 4], [5, 6]])

bool_idx = (a > 2)
print(bool_idx)

print(a[bool_idx])

print(a[a > 2])

[[False False]
 [ True  True]
 [ True  True]]
[3 4 5 6]
[3 4 5 6]

数据类型

import numpy as np

x = np.array([1, 2])  
print(x.dtype)         #int64

x = np.array([1.0, 2.0])  
print(x.dtype)             #float64

x = np.array([1, 2], dtype=np.float64)  #指定数据类型
print(x.dtype)

int32
float64
float64

数组计算

基本数学计算函数会对数组中元素逐个进行计算，既可以利用操作符重载，也可以使用函数方式

import numpy as np

x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)

print(x + y)
print(np.add(x, y))

print(x - y)
print(np.subtract(x, y))

print(x * y)
print(np.multiply(x, y))

print(x / y)
print(np.divide(x, y))

print(np.sqrt(x))

[[ 6.  8.]
 [10. 12.]]
[[ 6.  8.]
 [10. 12.]]
[[-4. -4.]
 [-4. -4.]]
[[-4. -4.]
 [-4. -4.]]
[[ 5. 12.]
 [21. 32.]]
[[ 5. 12.]
 [21. 32.]]
[[0.2        0.33333333]
 [0.42857143 0.5       ]]
[[0.2        0.33333333]
 [0.42857143 0.5       ]]
[[1.         1.41421356]
 [1.73205081 2.        ]]

和MATLAB不同，*是元素逐个相乘，而不是矩阵乘法。在Numpy中使用dot来进行矩阵乘法

import numpy as np

x = np.array([[1,2],[3,4]])
y = np.array([[5,6],[7,8]])

v = np.array([9,10])
w = np.array([11, 12])

print (v.dot(w))
print (np.dot(v, w))

print (x.dot(v))
print (np.dot(x, v))

print (x.dot(y))                 #后面的需要转置过来
print (np.dot(x, y))

219
219
[29 67]
[29 67]
[[19 22]
 [43 50]]
[[19 22]
 [43 50]]

sum函数

import numpy as np

x = np.array([[1,2],[3,4]])

print (np.sum(x))  #计算所有元素的和
print (np.sum(x, axis=0))  #计算每一列的和
print (np.sum(x, axis=1))  #计算每一行的和

10
[4 6]
[3 7]

T转置

import numpy as np

x = np.array([[1,2], [3,4]])
print (x)          
print (x.T) 
           
v = np.array([1,2,3])     #一维数组的转置不变
print (v)    
print (v.T)

[[1 2]
 [3 4]]
[[1 3]
 [2 4]]
[1 2 3]
[1 2 3]

广播Broadcasting

广播是一种强有力的机制，它让Numpy可以让不同大小的矩阵在一起进行数学计算。我们常常会有一个小的矩阵和一个大的矩阵，然后我们会需要用小的矩阵对大的矩阵做一些计算。

举个例子，如果我们想要把一个向量加到矩阵的每一行，我们可以这样做：

import numpy as np

x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])
y = np.empty_like(x)   #和x形状一样的空数组

for i in range(4):              #循环相加
    y[i, :] = x[i, :] + v

print (y)

[[ 2  2  4]
 [ 5  5  7]
 [ 8  8 10]
 [11 11 13]]

这样是行得通的，但是当x矩阵非常大，利用循环来计算就会变得很慢很慢。我们可以换一种思路：

import numpy as np

x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])
vv = np.tile(v, (4, 1))   #复制4份v  
print (vv)

y = x + vv 
print (y)

[[1 0 1]
 [1 0 1]
 [1 0 1]
 [1 0 1]]
[[ 2  2  4]
 [ 5  5  7]
 [ 8  8 10]
 [11 11 13]]

Numpy广播机制可以让我们不用创建vv，就能直接运算，看看下面例子：

import numpy as np

x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])
y = x + v  #直接相加
print (y)

[[ 2  2  4]
 [ 5  5  7]
 [ 8  8 10]
 [11 11 13]]

对两个数组使用广播机制要遵守下列规则：

1.如果数组的秩不同，使用1来将秩较小的数组进行扩展，直到两个数组的尺寸的长度都一样。
2.如果两个数组在某个维度上的长度是一样的，或者其中一个数组在该维度上长度为1，那么我们就说这两个数组在该维度上是相容的。
3.如果两个数组在所有维度上都是相容的，他们就能使用广播。
4.如果两个输入数组的尺寸不同，那么注意其中较大的那个尺寸。因为广播之后，两个数组的尺寸将和那个较大的尺寸一样。
5.在任何一个维度上，如果一个数组的长度为1，另一个数组长度大于1，那么在该维度上，就好像是对第一个数组进行了复制。