吴恩达深度学习课程笔记(一):神经网络与深度学习

吴恩达深度学习课程笔记(一):神经网络与深度学习

第一周:深度学习概论

image
数据量大的时候大的网络能提高性能。在小的数据集上,我们更应该关注特征的选取、算法实现的细节之类的内容,因为在小的数据集上,各种规模的网络表现差不多。

第二周 神经网络基础

2.1 二分类

image
使用这种方式表达样本在神经网络中是更常见的方式,即,每一列表示一个样本,每一行表示一个特征。
m 样本数量
n 特征数量

2.2 逻辑回归

  • 用sigmoid函数去限制 WX+b W X + b 的范围,即为逻辑回归。
    y^=σ(wx+b), where σ(z)=11+ez y ^ = σ ( w x + b ) ,   w h e r e   σ ( z ) = 1 1 + e − z

2.3 逻辑回归的代价函数

L(y,y^)=ylog(y^)(1y)log(1y^) L ( y , y ^ ) = − y l o g ( y ^ ) − ( 1 − y ) l o g ( 1 − y ^ )
Cost function:

J(w,b)=1mi=1m{  ylog(y^)+(1y)log(1y^)} J ( w , b ) = − 1 m ∑ i = 1 m {   y l o g ( y ^ ) + ( 1 − y ) l o g ( 1 − y ^ ) }

2.4 梯度下降

repeat:{ r e p e a t : {
w=wαJ(w)w w = w − α ∂ J ( w ) ∂ w
b=bαJ(b)b b = b − α ∂ J ( b ) ∂ b
} }

2.5 导数

2.6 更多关于导数的例子

2.7 计算图

2.8计算图上的导数

链式法则

2.9逻辑回归的梯度下降

a表示的是 y^ y ^ ,即逻辑回归的预测值。
对于sigmoid函数的求导为:
default
σ(z)=σ(z)( 1σ(z) ) σ ( z ) ′ = σ ( z ) (   1 − σ ( z )   )
image

dz=L(y^,y)z=L(y^,y)y^dσ(z)dz=(yy^+1y1y^){ y^(1y^)}=y^y(1)(2)(3)(4) (1) d z = ∂ L ( y ^ , y ) ∂ z (2) = ∂ L ( y ^ , y ) ∂ y ^ d σ ( z ) d z (3) = ( − y y ^ + 1 − y 1 − y ^ ) { y ^ ( 1 − y ^ ) } (4) = y ^ − y

dw1=x1dz d w 1 = x 1 d z dw2=x2dz d w 2 = x 2 d z db=dz d b = d z
那么,沿着代价函数梯度下降的方向更新参数:
w1=w1α dw1 w 1 = w 1 − α   d w 1
w2=w2α dw2 w 2 = w 2 − α   d w 2
b=bα db b = b − α   d b
就可以最终到达一个局部最优点。
这就是逻辑回归的梯度下降。
推导的最终结果是,我们在梯度下降的时候,不需要再去推导,直接利用结论
目前为止还只是单个样本的梯度下降。

2.10 在整个样本集上的梯度下降

Random initialization w1w2b R a n d o m   i n i t i a l i z a t i o n   w 1 、 w 2 、 b
Repeat until convergence: R e p e a t   u n t i l   c o n v e r g e n c e :
1. J=0, dw1=0, dw2=0, db=0 J = 0 ,   d w 1 = 0 ,   d w 2 = 0 ,   d b = 0
2. For i=1 to m: F o r   i = 1   t o   m :
3.         z(i)=WTX+b                 z ( i ) = W T X + b
4.         a(i)=σ(z(i))                 a ( i ) = σ ( z ( i ) )
5.         dz(i)=a(i)y(i)                 d z ( i ) = a ( i ) − y ( i )
6.         J +=y(i)loga(i)(1y(i))log(1a(i))                 J   + = − y ( i ) l o g a ( i ) − ( 1 − y ( i ) ) l o g ( 1 − a ( i ) )
7.         dw1 +=x(i)1dz(i)                 d w 1   + = x 1 ( i ) d z ( i )
8.         dw2 +=x(i)2dz(i)                 d w 2   + = x 2 ( i ) d z ( i )
9.         db +=dz(i)                 d b   + = d z ( i )
10. end For e n d   F o r
11. J=J/m J = J / m
12.

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值