神经网络参数的反向传播算法

这篇博客深入介绍了神经网络的反向传播算法,用于计算代价函数关于所有参数的导数。内容包括神经网络的代价函数、反向传播的过程、参数展开、梯度检验以及随机初始化的重要性。通过对神经网络的训练步骤的总结,强调了反向传播在神经网络学习中的关键作用。
摘要由CSDN通过智能技术生成

神经网络

    假设神经网络的训练样本有m个,每个包含一组输入x和一组输出信号y,L表示神经网络层数,SI表示每层的neuron个数(Sl表示输出层神经元个数),SL代表最后一层中处理单元的个数。

将神经网络的分类定义为两种情况:二类分类和多类分类,

二类分类:SL=0,y=0or1表示哪一类;

K类分类:SL=k,yi=1  表示分到第i类;(k>2)

 

我们回顾逻辑回归问题中我们的代价函数为:

    在逻辑回归中,我们只有一个输出变量,又称标量(scalar),也只有一个因变量yy,但是在神经网络中,我们可以有很多输出变量,我们的 hθ(x)是一个维度为K的向量,并且我们训练集中的因变量也是同样维度的一个向量,因此我们的代价函数会比逻辑回归更加复杂一些,

 

**神经网络代价函数为:

 

        

 

   这个看起来复杂很多的代价函数背后的思想还是一样的,我们希望通过代价函数来观察算法预测的结果与真实情况的误差有多大,唯一不同的是,对于每一行特征,我们都会给出KK个预测,基本上我们可以利用循环,对每一行特征都预测KK个不同结果,然后在利用循环在KK个预测中选择可能性最高的一个,将其与yy中的实际数据进行比较。

    正则化的那一项只是排除了每一层θ0后,每一层的θ 矩阵的和。最里层的循环j循环所有的行(由sl +1 层的激活单元数决定),循环i则循环所有的列,由该层(sl层)的激活单元数所决定。即:hθ(x)与真实值之间的距离为每个样本-每个类输出的加和,对参数进行regularization的bias项处理所有参数的平方和。

 

9.2 反向传播算法

    之前我们在计算神经网络预测结果的时候我们采用了一种正向传播方法,我们从第一层开始正向一层一层进行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值