深度学习-图解反向传播算法

最新推荐文章于 2024-08-15 09:37:39 发布

AI_王布斯

最新推荐文章于 2024-08-15 09:37:39 发布

阅读量1.1k

点赞数 1

分类专栏：深度学习文章标签：算法神经网络深度学习

本文链接：https://blog.csdn.net/weixin_42189597/article/details/120005837

版权

12 篇文章 2 订阅

订阅专栏

前一层的输出作为后一层的输入的逻辑结构，每一层神经元仅与下一层的神经元全连接，通过增加神经网络的层数虽然可为其提供更大的灵活性，让网络具有更强的表征能力，也就是说，能解决的问题更多，但随之而来的数量庞大的网络参数的训练，一直是制约多层神经网络发展的一个重要瓶颈。

反向传播（Backpropagation algorithm）全称“误差反向传播”，是在深度神经网络中，根据输出层输出值，来反向调整隐藏层权重的一种方法。

为什么不直接使用梯度下降而使用反向传播方式更新权重呢？
梯度下降应用于有明确求导函数的情况，或者可以求出误差的情况（比如线性回归），我们可以把它看做没有隐藏层的网络。
但对于多个隐藏层的神经网络，输出层可以直接求出误差来更新参数，但隐藏层的误差是不存在的，因此不能对它直接应用梯度下降，而是先将误差反向传播至隐藏层，然后再应用梯度下降。

1974年，哈佛大学沃伯斯博士在他的博士论文中，首次提出了通过误差的反向传播来训练人工神经网络，以解决神经网络数量庞大的参数训练问题。但是，沃伯斯的工作并没有得到足够的重视，因为当时神经网络正陷入低潮，可谓“生不逢时”
1986年，由杰弗里·辛顿（Geoffrey Hinton）和大卫·鲁姆哈特（David Rumelhart）等人在著名学术期刊Nature（自然）上发表了论文“借助误差反向传播算法的学习表征（Learning Representationsby Back-propagating errors）”，系统而简洁地阐述了反向传播算法在神经网络模型上的应用。反向传播算法非常好使，它直接把纠错的运算量降低到只和神经元数目本身成正比的程度。
后来，沃伯斯得到了IEEE（电气电子工程师学会）神经网络分会的先驱奖；Geoffrey Hinton与Yoshua Bengio、Yann LeCun（合称“深度学习三巨头”）共同获得了 2018年的图灵奖。

问题：Tom在超市买了2个苹果，每个10元，消费税10%，请计算应该支付的金额
问题：Tom在超市买了2个苹果，3个橙子，其中苹果每个10元，橙子每个 15元，消费税10%，请计算应该支付的金额
问题：Tom在超市买了2个苹果，每个10元，消费税10%，请计算苹果价格上涨会在多大程度上影响支付金额（即求“支付金额关于苹果的价格的导数”）。设苹果的价格为x，支付金额为L，则相当于L求x的偏微分。这个导数的值表示当苹果的价格稍微上涨时，支付金额会增加多少。

苹果价格的导数为2.2，苹果个数导数为11，消费税导数为20，可以解释为：苹果价格、苹果个数或消费税增加相同的值，分别对支付金额产生2.2倍、11倍、20倍的影响。