神经网络-误差反向传播算法(二)

本文详细介绍了神经网络中的误差反向传播算法,包括权重矩阵、偏置向量、激活值等概念,以及二次代价函数。通过四个基本方程阐述了如何计算网络中任意偏置和权重的改变率,提供了前向传播与反向误差传播的步骤,有助于理解神经网络的学习过程。
摘要由CSDN通过智能技术生成

神经网络与深度学习 (Michael Nielsen) \text{(Michael Nielsen)} (Michael Nielsen)笔记(二)
误差反向传播算法
首先定义神经网络中的一些重要参数
w j k l w^{l}_{jk} wjkl:表示从 ( l − 1 ) t h (l-1)^{\mathrm{th}} (l1)th层的第 k t h k^{\mathrm{th}} kth个神经元到 l t h l^{\mathrm{th}} lth层的第 j t h j^{\mathrm{th}} jth个神经元的连接权重,如下图所示

图片名称

b j l b_{j}^{l} bjl:表示在 l t h l^{\mathrm{th}} lth层第 j t h j^{\mathrm{th}} jth个神经元的偏置
a j l a_{j}^{l} ajl:表示 l t h l^{\mathrm{th}} lth层第 j t h j^{\mathrm{th}} jth个神经元的激活值,如下图所示:

图片名称

l t h l^{\mathrm{th}} lth 层第 j t h j^{\mathrm{th}} jth个神经元的激活值 a j l a_{j}^{l} ajl ( l − 1 ) t h (l-1)^{\mathrm{th}} (l1)th层的激活值通过下面方程关联起来 a j l = σ ( ∑ k w j k l a k l − 1 + b j l ) a_{j}^{l}=\sigma\left(\sum_{k} w_{j k}^{l} a_{k}^{l-1}+b_{j}^{l}\right) ajl=σ(kwjklakl1+bjl)其中求和是在 ( l − 1 ) t h (l-1)^{\mathrm{th}} (l1)th层的所有 k k k个神经元上进行的.
定义权重矩阵 w l w^l wl ,第 j t h j^{\mathrm{th}} jth行第 k t h k^{\mathrm{th}} kth列的元素就是 w j k l w_{j k}^{l} wjkl ,对每一层定义一个偏置向量,则 l t h l^{\mathrm{th}} lth层的偏置向量为 b l b^l bl激活向量定义为 a l a^l al,其元素为激活值 a j l a_{j}^{l} ajl,于是上式的向量形式可写成: a l = σ ( w l a l − 1 + b l ) a^{l}=\sigma\left(w^{l} a^{l-1}+b^{l}\right) al=σ(wlal1+bl)令中间量 z l ≡ w l a l − 1 + b l z^{l} \equiv w^{l} a^{l-1}+b^{l} zlwlal1+bl ,称 z l z^l zl l l l层神经元的带权输入,上式也写成 a l = σ ( z l ) a^{l}=\sigma\left(z^{l}\right) al=σ(zl)的形式, z l z^l zl的每个元素是 z j l = ∑ k w j k l a k l − 1 + b j l z_{j}^{l}=\sum_{k} w_{j k}^{l} a_{k}^{l-1}+b_{j}^{l} zjl=kwjklakl1+bjl z j l z_j^l zjl是第 l l l层第 j j j个神经元的激活函数的带权输入
二次代价函数: C = 1 2 n ∑ x ∥ y ( x ) − a L ( x ) ∥ 2 C=\frac{1}{2 n} \sum_{x}\left\|y(x)-a^{L}(x)\right\|^{2} C=2n1xy(x)aL(x)2 L L L表示网络的层数
Hahamard \boldsymbol{\text{Hahamard}} Hahamard乘积 s ⊙ t s \odot t st 表示按元素乘积,如: [ 1 2 ] ⊙ [ 3 4 ] = [ 1 ∗ 3 2 ∗ 4 ] = [ 3 8 ] \left[\begin{array}{l}{1} \\ {2}\end{array}\right] \odot\left[\begin{array}{l}{3} \\ {4}\end{array}\right]=\left[\begin{array}{l}{1 * 3} \\ {2 * 4}\end{array}\right]=\left[\begin{array}{l}{3} \\ {8}\end{array}\right] [12][34]=[1324]=[38]
反向传播的四个方程
为了计算偏导数 ∂ C ∂ w j k l \frac{\partial C }{ \partial w_{j k}^{l}} wjklC, ∂ C ∂ j l \frac{\partial C }{ \partial _{j}^{l}} jlC,首先引入一个中间量, δ j l \delta_{j}^{l} δj

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值