基于多层感知机的反向传播算法推导

机器学习课的作业,由于latex的公式编辑我很不熟悉,很多公式都没有编辑好,不过先发出来算了。后续我可能还会更新基于卷积神经网络的反向传播算法推导。

  1. 前馈神经网络的反向传播推导

定义如下记号描述网络:

L L L:神经网络的层数

n l n^{l} nl:表示第 l l l层神经元的个数

f l ( ) f_{l}() fl(): 第 l l l层神经元激活函数

W ( l ) ∈ R n l × n l − 1 W^{\left( l \right)} \in R^{n^{l} \times n^{l - 1}} W(l)Rnl×nl1:表示第 l − 1 l - 1 l1层到第 l l l层的权重矩阵

b ( l ) ∈ R n l b^{(l)} \in R^{n^{l}} b(l)Rnl:表示第 l − 1 l - 1 l1层到第 l l l层的偏置

z ( l ) ∈ R n l z^{(l)} \in R^{n^{l}} z(l)Rnl:表示第 l l l层的神经元状态

a ( l ) ∈ R n l a^{(l)} \in R^{n^{l}} a(l)Rnl:表示第 l l l层的神经元活性值

前馈神经网络通过下面公式进行信息传播:

z ( l ) = W ( l ) ∙ a ( l − 1 ) + b ( l ) z^{\left( l \right)} = W^{\left( l \right)} \bullet a^{\left( l - 1 \right)} + b^{\left( l \right)} z(l)=W(l)a(l1)+b(l)

a ( l ) = f l ( z ( l ) ) a^{\left( l \right)} = f_{l}\left( z^{\left( l \right)} \right) a(l)=fl(z(l))

公式也可以写成:

z ( l ) = W ( l ) ⋅ f l ( z ( l − 1 ) ) + b ( l ) z^{\left( l \right)} = W^{\left( l \right)} \cdot f_{l}\left( z^{\left( l - 1 \right)} \right) + b^{\left( l \right)} z(l)=W(l)fl(z(

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值