（2）杂乱篇

最新推荐文章于 2024-09-06 23:56:13 发布

NoMoreSorrow.

最新推荐文章于 2024-09-06 23:56:13 发布

阅读量218

点赞数

文章标签：神经网络

本文链接：https://blog.csdn.net/ybt99999/article/details/130442605

版权

文章介绍了反向传播在神经网络中的作用，通过计算误差来更新权重。学习率控制权重更新的幅度。优化器如梯度下降用于最小化损失函数。常见的损失函数包括L1Loss、MSELoss和CrossEntropyLoss。激活函数如ReLU因其非线性、计算效率和防止梯度消失等优点，在神经网络中优于Sigmoid和tanh。

摘要由CSDN通过智能技术生成

前言

前向传播：从输入到输出的过程
反向传播：将网络的输出与预期结果进行比较，并计算出错误，将该错误通过网络一次传播回来，并根据它们对错误的贡献量更新权重。

一、反向传播的过程

1、利用前向传播求出误差E
交叉熵损失公式
2、求出误差E对权重W的偏导数，
3、利用，权重更新公式更新权重W，其中 α 是学习率
梯度下降法进行权重更新
4、继续反向传播，更新更接近输入层的权重W，直到更新所有的权重W，
5、循环1,2,3,4过程，不断更新权重W，降低误差E，最终得到训练好的神经网络（即适合的权重W）

二、学习率

学习率：控制每次根据估计误差对模型权重更新的多少
以梯度下降为例：
偷的图

三、优化器

简单来说，优化器可以优化损失函数，优化器的工作是以使损失函数最小化的方式更改可训练参数，损失函数指导优化器朝正确的方向移动。
优化器即优化算法是用来求取模型的最优解的，通过比较神经网络自己预测的输出与真实标签的差距，也就是Loss函数。为了找到最小的loss（也就是在神经网络训练的反向传播中，求得局部的最优解），通常采用的是梯度下降
采用不同优化器，权重更新的公式有所不同。
在这里插入图片描述