吴恩达之深度学习和神经网络-2.10-2.12向量化

最新推荐文章于 2024-06-25 08:45:56 发布

为援不可图

最新推荐文章于 2024-06-25 08:45:56 发布

阅读量396

点赞数

分类专栏：视频资料文章标签： neural network

本文链接：https://blog.csdn.net/qq_32113189/article/details/79981767

版权

视频资料专栏收录该内容

15 篇文章 0 订阅

订阅专栏

什么是向量化，为什么引入向量化。
以logistic线性回归为例， $z=w^Tx+b$
$w=[w_{1}、w_{2},,,w_{n}]$
$x=[x_{1}、x_{2},,,x_{n}]$
非向量化实现：
$z=0$
for i in range(n):
$z+=w[i]*x[i]$
$z+=b$
向量化实现：
$z=np.dot(w,x)+b$
以上两个程序分别对 $z=w^Tx+b$ 进行实现，非向量化采用for循环，而向量化则完全的隐藏了for循环，因为，在深度学习中，要去训练大量的数据，要是采用for循环，将会把训练时间拉伸的很长，这对于深度学习来说并不是那么理想。
因此，采用向量化的原因就是避免for循环的使用，在以后的日常编程当中，要尽可能做到以内函数来替代for循环，这样，我们的程序将会快很多。
那如何使用内函数避免for循环的使用，这里将会用到一个python的内置库-numpy，这个库十分强大，几乎就是为了数学计算而产生的，我们几乎能用到的数学公式都可以从numpy中找到并使用，避免了for循环，极大的缩短程序运行时间。

# -*- coding: utf-8 -*-

import numpy as np
import time

a = np.random.rand(1000000)
b = np.random.rand(1000000)

tic = time.time()
c = np.dot(a,b)
toc = time.time()
print(c)
print('vectorized version:'+str(1000*(toc-tic))+'ms')
c = 0
tic = time.time()
for i in range(1000000):
    c += a[i]*b[i]
toc = time.time()
print(c)
print('vectorized version:'+str(1000*(toc-tic))+'ms')

这里写图片描述
可以看出来，向量化比for循环的时间要缩短将近100倍的时间，这在深度学习中将是非常重要的，可以大幅度缩短训练时间。
看下面的例子：
$J=0,dw_{1}=0,dw_{2}=0,db=0$
for i = 1 to n:
$z^{(i)}=w^Tx^{(i)}+b$
$a^{(i)}=\sigma(z^{(i)})$
$J += -[y^{(i)}log\hat{y}^{(i)}+(1-y^{(i)})log(1-\hat{y}^{(i)})]$
$dz^{(i)} = a^{(i)}(1-a^{(i)})$
$dw_{1} += x_{1}^{(i)}dz^{(i)}$
$dw_{2} += x_{2}^{(i)}dz^{(i)}$
$db += dz^{(i)}$
$J = J/m,dw_{1}=dw_{1}/m,dw_{2}=dw_{2}/m,db=db/m$
向量化之后的式子为：
$J=0,dw=np.zeros((n_{x},1)),db=0$
for i = 1 to n:
$z^{(i)}=w^Tx^{(i)}+b$
$a^{(i)}=\sigma(z^{(i)})$
$J += -[y^{(i)}log\hat{y}^{(i)}+(1-y^{(i)})log(1-\hat{y}^{(i)})]$
$dz^{(i)} = a^{(i)}(1-a^{(i)})$
$dw += x^{(i)}dz^{(i)}$
$db += dz^{(i)}$
$J = J/m,dw=dw/m,db=db/m$
numpy中有许多可以用作数学计算公式的方法，譬如：
np.exp(v)求每一个值的指数
np.log(v)求每一个值得log值等等

为援不可图

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达之深度学习和神经网络-2.10-2.12向量化

什么是向量化，为什么引入向量化。以logistic线性回归为例，z=wTx+bz=wTx+bz=w^Tx+b w=[w1、w2,,,wn]w=[w1、w2,,,wn]w=[w_{1}、w_{2},,,w_{n}] x=[x1、x2,,,xn]x=[x1、x2,,,xn]x=[x_{1}、x_{2},,,x_{n}] 非向量化实现： z=0z=0z=0 for i in range(n...
复制链接

扫一扫

专栏目录