反向传播推导(方差)

本文详细介绍了多层感知机(MLP)中的关键组件,包括权重矩阵w和偏置b在不同层(输入层、隐藏层和输出层)的应用,以及如何进行参数更新。重点讲述了隐藏层的权重和偏置处理以及简化过程。
摘要由CSDN通过智能技术生成
o-1层xix_1^{o-1}x_2^{o-1}x_3^{o-1}...
o-1层wijw_{11}^{o-1}w_{12}^{o-1}w_{13}^{o-1},...w_{21}^{o-1}w_{22}^{o-1}w_{23}^{o-1},...w_{31}^{o-1}w_{32}^{o-1}w_{33}^{o-1},......
o-1层zjz_1^{o-1}z_2^{o-1}z_3^{o-1}...
o-1层yj, o层xiy_1^{o-1}x_1^oy_2^{o-1}x_2^oy_3^{o-1}x_3^o...
o层wijw_{11}^{o}w_{12}^{o}w_{13}^{o},...w_{21}^{o}w_{22}^{o}w_{23}^{o},...w_{31}^{o}w_{32}^{o}w_{33}^{o},......
o层zjz_1^{o}z_2^{o}z_3^{o}...
o层yjy_1^oy_2^oy_3^o...

一、输出层

E = \frac{1}{2}\sum_j (y_{j}-t_{j})^2

1.权重w 

 \frac{\partial E}{\partial w_{ij}^{o}}= \frac{\partial}{\partial w_{ij}^{o}}(\frac{1}{2}\sum_j (y_{j}-t_{j})^2)=(y_{j}-t_{j})\frac{\partial y_{j}}{\partial w_{ij}^{o}}

 \frac{\partial y_{j}}{\partial w_{ij}^{o}}=\frac{\partial}{\partial w_{ij}^{o}}(f(\sum_l w_{lj}^ox_{l}^o+b_{j}^o))=f'(z_j^o)\sum_l\frac{\partial}{\partial w_{ij}^{o}}(w_{lj}^ox_{l}^o+b_{j}^o) = f'(z_j^o)x_i^o

 \frac{\partial E}{\partial w_{ij}^{o}}=(y_{j}-t_{j})f'(z_j^o)x_i^o

2.偏置b

\frac{\partial E}{\partial b_j^{o}}= \frac{\partial}{\partial b_j^{o}}(\frac{1}{2}\sum_j (y_{j}-t_{j})^2)=(y_{j}-t_{j})\frac{\partial y_{j}}{\partial b_j^{o}} 

\frac{\partial y_{j}}{\partial b_j^{o}}=\frac{\partial}{\partial b_j^{o}}(f(\sum_l w_{lj}^ox_{l}^o+b_{j}^o))=f'(z_j^o)\sum_l\frac{\partial}{\partial b_j^{o}}(w_{lj}^ox_{l}^o+b_{j}^o) = f'(z_j^o) 

 \frac{\partial E}{\partial b_j^{o}}=(y_{j}-t_{j})f'(z_j^o)

3.简化 

\delta_j^o =(y_{j}-t_{j})f'(z_j^o) 

 \frac{\partial E}{\partial w_{ij}^{o}}=\delta_j^ox_i^o

 \frac{\partial E}{\partial b_j^{o}}=\delta_j^o

二、隐藏层 

1.权重w 

\frac{\partial E}{\partial w_{ij}^{o-1}}= \frac{\partial}{\partial w_{ij}^{o-1}}(\frac{1}{2}\sum_k (y_{k}-t_{k})^2)=\sum_k(y_{k}-t_{k})\frac{\partial y_{k}}{\partial w_{ij}^{o-1}} 

\frac{\partial y_{k}}{\partial w_{ij}^{o-1}}=\frac{\partial}{\partial w_{ij}^{o-1}}(f(\sum_l w_{lk}^oy_{l}^{o-1}+b_{k}^o))=f'(z_k^o)w_{jk}^o\frac{\partial y_j^{o-1}}{\partial w_{ij}^{o-1}}= f'(z_k^o)w_{jk}^of'(z_j^{o-1})x_i^{o-1} 

 \frac{\partial E}{\partial w_{ij}^{o-1}}=\sum_k(y_{k}-t_{k})f'(z_k^o)w_{jk}^of'(z_j^{o-1})x_i^{o-1} = \sum_k \delta_k^ow_{jk}^of'(z_j^{o-1})x_i^{o-1}

 2.偏置b

 \frac{\partial E}{\partial b_j^{o-1}}= \frac{\partial}{\partial b_j^{o-1}}(\frac{1}{2}\sum_k (y_{k}-t_{k})^2)=\sum_k(y_{k}-t_{k})\frac{\partial y_{k}}{\partial b_j^{o-1}} \frac{\partial y_{k}}{\partial b_j^{o-1}}=\frac{\partial}{\partial b_j^{o-1}}(f(\sum_l w_{lk}^oy_{l}^{o-1}+b_{k}^o))=f'(z_k^o)w_{jk}^o\frac{\partial y_j^{o-1}}{\partial b_j^{o-1}}= f'(z_k^o)w_{jk}^of'(z_j^{o-1}) 

 \frac{\partial E}{\partial b_j^{o-1}}=\sum_k(y_{k}-t_{k})f'(z_k^o)w_{jk}^of'(z_j^{o-1})= \sum_k \delta_k^ow_{jk}^of'(z_j^{o-1})

3.简化

 \delta_j^{o-1} =\sum_k\delta_k^ow_{jk}^of'(z_j^{o-1})

 \frac{\partial E}{\partial w_{ij}^{o-1}}=\delta_j^{o-1}x_i^{o-1}

 \frac{\partial E}{\partial b_j^{o-1}}=\delta_j^{o-1}

 三、更新

1.权重w 

\Delta w_{ij}^m = -\eta \delta_j^mx_i^m 

w_{ij} = w_{ij} +\Delta w_{ij}  

2.偏置b

\Delta b_{j}^m = -\eta \delta_j^m 

b_{j} = b_{j} +\Delta b_{j} 

应用:多层感知机(MLP)-CSDN博客 

  • 6
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

VAMOT

您的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值