反向传播

最新推荐文章于 2024-08-28 17:00:50 发布

那就整一个呗

最新推荐文章于 2024-08-28 17:00:50 发布

阅读量114

点赞数

分类专栏：深度学习文章标签：神经网络

本文链接：https://blog.csdn.net/czdecsdn/article/details/112850904

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文详细解释了反向传播中的权重更新过程，包括输入向量处理、误差计算、误差传递到各层并调整权重矩阵的方法。通过Sigmoid激活函数实例，展示如何单独调整第一行权重及整个权重矩阵，以最小化误差并优化网络性能。

摘要由CSDN通过智能技术生成

反向传播

输入

输入一般是n维列向量 $I=\begin{bmatrix} i_1\\i_2\\i_3\\..\\i_n \end{bmatrix}$
目标是已给出的m维列向量，记为： $T=\begin{bmatrix} t_1\\t_2\\t_3\\..\\t_m \end{bmatrix}$

权重

权重矩阵 $W_{mn}=\begin{bmatrix} w_{11} & w_{12} & w_{13}&...&w_{1n} \\ w_{21} & w_{22} & w_{23}&...&w_{2n} \\ ....\\ w_{m1} & w_{m2} & w_{m3}&...&w_{mn} \end{bmatrix}$

输出

输出是矩阵R经过激活函数处理过的数据，下面以 $S i g m o i d$ 函数作为激活函数为例说明，输出矩阵 $O$ 如何从 $R$ 计算的到，如下

$\begin{bmatrix} o_1\\o_2\\o_3\\..\\o_m \end{bmatrix} =\begin{bmatrix} w_{11} & w_{12} & w_{13}&...&w_{1n} \\ w_{21} & w_{22} & w_{23}&...&w_{2n} \\ ....\\ w_{m1} & w_{m2} & w_{m3}&...&w_{mn} \end{bmatrix} \centerdot\begin{bmatrix} i_1\\i_2\\i_3\\..\\i_n \end{bmatrix}$

误差

误差既目标 $T$ 和输出 $O$ 的差值，如下

$O=\begin{bmatrix} e_1\\e_2\\e_3\\..\\e_m \end{bmatrix}$

误差传递

$O_3 = \displaystyle\sum_{x=1}^n w_{3x}i_x$

所以可对节点 $a_3$ 的误差 $e_3$ 按照权重比例向第2层进行划分

$PSe_3=\begin{bmatrix} i_1\\i_2\\i_3\\..\\i_n \end{bmatrix} \centerdot e_3$

那么可知第3层所有节点的误差 $S e$ ，传递到第2层的结果

$\displaystyle\sum_{x=1}^m PEx$

上式可化为：

$W_{mn}\top\centerdot Se$

误差衡量

使用误差衡量的目的是为使误差最小化，方便转化为数学问题，对函数求极值。举个例子使用误差的平方作为误差函数

$\displaystyle\sum_{i=1}^m(e_i)^2 =\displaystyle\sum_{i=1}^m\Big( T−O\Big)^2$

则误差取得极小值的时候即为误差函数的导函数值为0时

权重如何调整

假设现有一个双层网络输入数据为 $I$ ，输出数据为 $O$ ，目标结果为 $T$ ，衡量函数为 $E$ ，权重矩阵为 $W$ ，学习率为 $L r$ 。

单独调整权重 $w_{11}$

调整 $W$ 中的元素 $w_{11}$ ，又因为受 $w_{11}$ 响应的数据只有 $o_1$ ，原误差函数中的其余元素可以看做常数，暂不考虑，所以可得如下函数对变量 $w_{11}$ 求偏导，

$\big( t_1−o_1\big)^2$

由于 $o_1$ 也是自变量 $w_{11}$ 的因变量，二者关系如下，并且加号后面表达式为常数：

$o_1(w)=\displaystyle\sum_{a=1}^nw_{1a} i_a\\ o_1(w) =w_{11}i_1+\displaystyle\sum_{a=2}^nw_{1a} i_a$

该式又可写为：

$f(w)=w_{11} i_1~~ ~~ ~~ ~~ ~~ ~~ ~~ ~~ ~~ (1)$

由于 $G$ 中 $t_1$ 为常数

$G_o' = -2(t_1-o_1)$

$G_f' = -2(t_1-o_1)o_1'=-2(t_1-o_1)i_1$

$G'_{w_{11}}= -2(t_1-w_{11}i_1+\displaystyle\sum_{a=2}^nw_{1a} i_a)i_1$

调整第一行矩阵 $w_{11}$ 到 $w_{1n}$

$w_{11}$ 调整函数已得出，接下来考虑调整 $w_{12}$ ，同样因为受 $w_{12}$ 影响的节点只有输出 $O$ 中的 $o_1$ ，不同的是
$f(w_{12})=w_{12} i_2$ 对应的导数是 $i_2$
所以 $w_{12}$ 调整函数是

$G'_{w_{12}}= -2(t_2-w_{12}i_2+\displaystyle\sum_{a!=2}^nw_{1a} i_a)i_2$

调整权重矩阵

所求矩阵 $C e$ 第一行是

$Ce_1=g_1* \begin{bmatrix}w_{11}&w_{12}&...&w_{1n}& \end{bmatrix}$

所以可得所求矩阵 Ce第二行是

$Ce_2=g_2* \begin{bmatrix}w_{21}&w_{22}&...&w_{2n}& \end{bmatrix}\centerdot\begin{bmatrix}i_{1}\\i_{2}\\...\\i_{n}\end{bmatrix}$

同理第m行

$Ce_m=g_m* \begin{bmatrix}w_{m1}&w_{m2}&...&w_{mn}&\end{bmatrix}\centerdot\begin{bmatrix}i_{1}\\i_{2}\\...\\i_{n}\end{bmatrix}$

令 $\begin{bmatrix}g_1\\g_2\\...\\g_m\end{bmatrix}$

可得所求矩阵 $Z\centerdot I$

如果最终 $W = W - C e$

那就整一个呗

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
反向传播

神经网络概念输入层权重层输出层激活函数误差误差传递：反馈损失函数学习率求权重调整值首先损失函数EEE对wijw_{ij}wij求导举个例子对 w11w_{11}w11 求导在根据导数算出损失函数EEE取得极小值时WijW_{ij}Wij的取值调整 wijw_{ij}wij ，同时需要考虑学习率欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPa
复制链接

扫一扫