Learning representations by back-propagating errors原文解读

最新推荐文章于 2022-07-26 22:46:45 发布

微电子学与固体电子学-俞驰

最新推荐文章于 2022-07-26 22:46:45 发布

阅读量4.3k

点赞数 1

分类专栏：图像与神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/appleyuchi/article/details/86256257

版权

图像与神经网络专栏收录该内容

40 篇文章 9 订阅

订阅专栏

反向传播的原文是：
1986年的《Learning representations by back-propagating errors》

$x_j=\sum_iy_iw_{ji}(1)$
$y_j=\frac{1}{1+e^{-x_i}}(2)$
这个就是Sigmoid函数

$E=\frac{1}{2}\sum_c\sum_j(y_{j,c}-d_{j,c})^2(3)$

$\frac{∂E}{∂y_j}=y_j-d_j(4)$
$\frac{∂E}{∂x_j}=\frac{∂E}{∂y_j}y_j(1-y_j)(5)$

$\frac{∂E}{∂w_{ji}}=\frac{∂E}{∂x_j}·\frac{∂x_j}{∂w_{ji}}=\frac{∂E}{∂x_j}y_i(6)$

$\frac{∂E}{∂y_i}=\sum_j\frac{∂E}{∂x_j}·w_{ji}(7)$

$\Delta w=-\varepsilon\frac{∂E}{∂w}(8)$
$\Delta w(t)=-\varepsilon\frac{∂E}{∂w(t)}+\alpha\Delta w(t-1)(9)$

原文没有提及b是怎么变化的,另外参考了下文献:
https://blog.csdn.net/qq_29762941/article/details/80343185
$\Delta b=-\varepsilon\frac{∂E}{∂b}$

##########如何记忆######################

首先记住这个神经元：

在这里插入图片描述

然后就是下面的一大堆
$\frac{∂E}{∂w_{ji}}=\frac{∂E}{∂y_j}·\frac{∂y_j}{∂x_j}·\frac{∂x_j}{∂w_{ji}}$
上面三个因子怎么计算呢？
$\frac{∂E}{∂y_j}的计算:\frac{1}{2}(d_j-y_j)^2,d_j是实际的类别标签,y_j是预测结果$ 剩下就是求导操作。

$\frac{∂y_j}{∂x_j}的计算：就是对式(2)进行求导$

$\frac{∂x_j}{∂w_{ji}}的计算：这里的x_j不要误解成是整个神经元的输入端，而是激活函数的输入端，所以这个的结果就是y_i$

hidden unit 就是放激活函数的。
也就是后期论文中常见的隐藏层。

怎么个传播法呢？
最后就是 $w_{ji}=-\varepsilon\triangle w+w_{ji}$

微电子学与固体电子学-俞驰

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。