深度学习笔记1-吴恩达-斯坦福课程
在深度学习(deeplearning)里,我们常常需要进行很多的梯度下降等之类需要循环的,使用显式的循环会让运算速度十分的缓慢,将数据向量化,充分利用计算机的并行性能,让计算变得更高效。
在Python的numpy模块,向量化得到了充分的展现,下面是一个例子。
先导入numpy库,创建数组的方法如下
import numpy as np #导入numpy库
a = np.array([1,2,3,4]) #创建数组a
print(a) #打印a
输出结果为一个数组
[1 2 3 4]
下面为矢量化计算与for循环的计算时间比较
import time #导入time库计算两次不同操作花费了多长时间
a = np.random.rand(1000000) #用随机数值创建一个百万维度的数组
b = np.random.rand(1000000)
tic = time.time()#测量当前时间
c = np.dot(a,b)
toc = time.time()#结束时间
print(c)
print("vecterlized version:"+str(1000*(toc-tic))+"ms")#向量计算持续时间
c = 0
tic = time.time()
for i in range(1000000):
c += a[i]*b[i]
toc = time.time()
print(c)#确认两个案例中c相同
print("for loop:"+str(1000*(toc-tic))+"ms")#for循环计算持续时间
输出结果为
250120.44528041838
vecterlized version:46.033382415771484ms
250120.44528041952
for loop:3044.8148250579834ms
可以看到两者输出的C差不多是相同的,但是计算速度却相差了几十倍,说明在计算速度上向量运算更加高效。