正向传播,反向传播,矩阵求导

正向传播

正向传播是指数据X传入到神经网络,经过各个隐藏层得到最终损失值的过程。
本次就以逻辑回归模型为例讲解一下正向传播以及反向传播。
逻辑回归模型一般用来解决二分类问题, y ^ = P ( y = 1 ∣ x ) \hat{y}=P(y=1 \mid x) y^=P(y=1x)表示y = 1的概率,取值范围在[0,1]之间。引入线性模型:
y ^ ( i ) = w T x ( i ) + b \hat{y}^{(i)}=w^{T} x^{(i)}+b y^(i)=wTx(i)+b
其中 w w w是权重系数, b b b是个常数项, w w w的维度为 ( n x , 1 ) \left(n_{x}, 1\right) (nx,1),可以看出该线性模型的输出区间为整个实数区间,而逻辑回归要求输出范围在[0,1]之间。所以我们需要引入Sigmoid激活函数,逻辑回归预测输出可以写为:
y ^ = Sigmoid ⁡ ( w T x ( i ) + b ) = σ ( w T x ( i ) + b ) \hat{y}=\operatorname{Sigmoid}\left(w^{T} x^{(i)}+b\right)=\sigma\left(w^{T} x^{(i)}+b\right) y^=Sigmoid(wTx(i)+b)=σ(wTx(i)+b)
Sigmoid函数是一种非线性函数,它的表达式以及曲线如下图表示:
 Sigmoid  ( z ) = 1 1 + e − z \text { Sigmoid }(z)=\frac{1}{1+e^{-z}}  Sigmoid (z)=1+ez1
在这里插入图片描述
Sigmoid函数导数表达式:
σ ′ ( z ) = σ ( z ) ( 1 − σ ( z ) ) \sigma^{\prime}(z)=\sigma(z)(1-\sigma(z)) σ(z)=σ(z)(1σ(z))
由函数曲线图可以看出,Sigmoid函数的输出范围在[0,1]之间,这样也就将逻辑回归的输出限定在[0,1]之间。常用的激活函数还有Tanh函数、Relu函数、Leaky Relu函数。
逻辑回归模型中, w w w b b b都是未知参数,需要通过反复训练优化得到最优值。因此,我们需要定义一个cost function,包含了参数 w w w b b b。通过梯度下降法优化cost function,当cost function取值最小时,得到对应的 w w w b b b。cost function定义为:
J ( w , b ) = 1 m ∑ i = 1 m L ( y ^ ( i ) , y ( i ) ) = − 1 m ∑ i = 1 m [ y ( i ) log ⁡ y ^ ( i ) + ( 1 − y ( i ) ) log ⁡ ( 1 − y ^ ( i ) ) ] \begin{array}{c} J(w, b)=\frac{1}{m} \sum_{i=1}^{m} L\left(\hat{y}^{(i)}, y^{(i)}\right)=-\frac{1}{m} \sum_{i=1}^{m}\left[y^{(i)} \log \hat{y}^{(i)}+\left(1-y^{(i)}\right) \log \left(1-\hat{y}^{(i)}\right)\right] \end{array} J(w,b)=m1i=1mL(y^

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值