反向传播(Back propagation)笔记

最新推荐文章于 2023-12-31 01:10:50 发布

bloodycity

最新推荐文章于 2023-12-31 01:10:50 发布

阅读量317

点赞数

分类专栏：大学课程笔记知识笔记文章标签：算法神经网络深度学习

本文链接：https://blog.csdn.net/weixin_39535685/article/details/106009448

版权

本文详细介绍了反向传播算法在深度学习中的应用，包括反向传播的基本概念、深度学习知识背景、相关数学知识如链式法则和多元函数微分，以及在L2 规整化回归和多层感知器中的应用。通过反向传播，可以有效地计算神经网络的梯度，用于优化权重。总结中强调反向传播在现代神经网络中的核心地位，尽管其生物学解释尚待深入研究。

摘要由CSDN通过智能技术生成

反向广播 (Backpropagation)

Based on slides and readings by R. Grosse
此文为私人学习的笔记

总览

反向广播几乎可以硕士深度学习的核心模块
- 反向传播是一个用于计算梯度的算法
- 反向传播是一个自动逆向计算微分的实例，它的应用甚至比神经网络本身更加广泛
- 而自动微分实际上是一个对于链式法则求导的聪明的高效的应用

深度学习知识背景

任务(目的)：回归，二元区分，多元区分
模型: 线性的，log线性的，多层感知的
损失方程：错误值(偏差)的平方, 0-1 的损失(Normalize)，交叉熵，折页损失(hinge loss)
优化算法：直接方案，梯度下降，感知层
- 这之中我们需要用到反向传播来计算梯度
- 而梯度下降就是向着梯度相反的方向移动
- 多层神经网络的权重空间: 针对一层网络的权重和偏差值的一个组合
- 而我们用一下公式来计算消费梯度 $\frac{d\varepsilon}{dw}$ ，也就是一个关于部分导数的向量
  - 而在训练中我们用 $\frac{d\mathcal{L}}{dw}$ 的均值来作为训练样本