【深度学习】BP算法-误差逆传播算法详解

最新推荐文章于 2024-07-02 20:59:51 发布

dominic_z

最新推荐文章于 2024-07-02 20:59:51 发布

阅读量1.1k

点赞数 2

分类专栏：机器学习与数据挖掘

本文链接：https://blog.csdn.net/dominic_z/article/details/87859024

版权

前些开始准备找实习找工作了，复习机器学习算法的时候发现BP算法又忘了，这次写博客记录一下，由于我矩阵知识不是很好，所以这篇文章没有以矩阵运算的方式来讲解。本文表面是原创，实际上参考了很多很多文章

符号与神经网络结构说明

在这里插入图片描述

$L$ : 当前神经网络的总层数
$n^{l}$ : 第 $l$ 层神经元拥有的神经元个数
$\alpha^{l}_{i}$ : 第 $l$ 层神经网络中的第 $i$ 个神经元的输入
$\beta^{l}_{i}$ : 第 $l$ 层神经网络中的第 $i$ 个神经元的输出
$w^{l}_{ij}$ : 第 $l$ 层神经网络中的第 $i$ 个神经元的到第 $l + 1$ 层神经网络中的第 $j$ 个神经元的权重
$b^{l}_{j}$ : 第 $l$ 层神经网络中到第 $l + 1$ 层神经网络中第 $j$ 个神经元的的偏置项（想不出来叫啥了）
$E$ : 神经网络的总损失
$f$ : 激活函数
$M$ : 总样本数
$x_{ij}$ : 第 $i$ 个样本的第 $j$ 个属性值（特征值，whatever）
$y_{ij}$ : 第 $i$ 个样本的第 $j$ 个输出的真实值
$\hat{y}_{ij}$ : 神经网络对于第 $i$ 个样本在第 $j$ 个输出的预测值，也就是 $\beta^{L}_{j}$

一些准备知识

神经网络内部的运算

神经元的输入与输出的关系： $\beta^{l}_{i}=f(\alpha^{l}_{i})$
第 $l$ 层神经元与第 $l + 1$ 层神经元之间的关系： $\alpha^{l+1}_{j}=\sum_{k=1}^{n^{l}}w^{l}_{kj}\beta^{l}_{k}+b^{l}_{j}$
常用的均方损失： $E=\sum_{m=1}^{M}\frac{1}{2}\sum_{k}^{n^L}(y_{mk}-\hat{y}_{mk})^2$

求导的链式法则

如果 $y = g (x), z = h (y)$ ，那么有 $\frac{\partial z}{\partial x}=\frac{\partial z}{\partial y}\frac{\partial y}{\partial x}$
如果 $y_1=g(x),y_2=h(x),z=k(y_1,y_2)$ ，那么有 $\frac{\partial z}{\partial x}=\frac{\partial z}{\partial y_1}\frac{\partial y_1}{\partial x}+\frac{\partial z}{\partial y_2}\frac{\partial y_2}{\partial x}$

最低0.47元/天解锁文章

dominic_z

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】BP算法-误差逆传播算法详解

前些开始准备找实习找工作了，复习机器学习算法的时候发现BP算法又忘了，这次写博客记录一下，由于我矩阵知识不是很好，所以这篇文章没有以矩阵运算的方式来讲解。本文表面是原创，实际上参考了很多很多文章符号与神经网络结构说明LLL : 当前神经网络的总层数nln^{l}nl : 第lll层神经元拥有的神经元个数αil\alpha^{l}_{i}αil : 第lll层神经网络中的第iii个神经元...
复制链接

扫一扫

专栏目录