【weekly-sharing】反向传播算法在神经网络的应用

最新推荐文章于 2024-01-07 02:10:25 发布

yangccnn

最新推荐文章于 2024-01-07 02:10:25 发布

阅读量949

点赞数

分类专栏： machine-learning deep-learning 文章标签：神经网络算法反向传播算法

本文链接：https://blog.csdn.net/qq_33819591/article/details/78451338

版权

本文介绍了反向传播算法在神经网络中的应用，详细阐述了基础概念，包括导数、梯度和代价函数。反向传播算法利用链式法则计算网络中参数的梯度，以便通过梯度下降法最小化代价函数。文章还讨论了反向传播的四个关键方程，并解释了如何计算误差，以更新网络权重和偏置。

摘要由CSDN通过智能技术生成

当通过神经网络输入 $x$ ，得到输出 $\hat{y}$ 时，这些信息通过神经网络向前流动，这称之为前向传播（forward propagation）。

在网络得到输出时会得到一个代价函数，允许来自代价函数的信息通过网络向后流动，来计算梯度的过程叫反向传播（back propagation）

反向传播算法主要用于计算梯度

导数
描述函数变化率
方向导数
某个方向上的导数
梯度
梯度的方向是方向导数中取最大值的方向，值是方向导数的最大值。如在二维中，梯度计算：

$\nabla θ = (\partial θ \partial x, \partial θ \partial x)$ $\nabla \theta = (\frac{\partial \theta}{\partial x},\frac{\partial \theta}{\partial x})$
对矩阵的梯度计算如下图：
代价函数（损失函数）
代价函数（cost function）即损失函数（loss function）。如在机器学习中，真实值为 $y$ ，而预测值为 $\hat{y}$ 。代价函数就是来度量预测错误的程度。常写作 $C$ 或 $L$ 。
链式法则
链式法则（chain rule）求复合函数导数的一个法则，如：

$(f (g (x)))' = f' (g (x)) g' (x)$ $(f(g(x)))' = f'(g(x))g'(x)$
$d y$

关注

专栏目录