Lesson5、6、7汇报

看海天一色听风起雨落

已于 2024-04-19 09:40:38 修改

阅读量635

点赞数 15

分类专栏： My Task 文章标签：学习笔记

于 2024-04-18 17:39:50 首次发布

本文链接：https://blog.csdn.net/qq_52245889/article/details/137903386

版权

My Task 专栏收录该内容

26 篇文章

订阅专栏

本文介绍了反向传播算法在神经网络学习中的重要性，从1970年代的发展到1986年论文的发表，阐述了其如何通过链式法则减少计算梯度的时间。文章详细剖析了前向传播和反向传播的计算复杂性，并提及了前馈神经网络和反向传播网络的概念，以及反向传播对参数更新速度的提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

反向传播最初是在 1970 年代引入的，但直到 1986 年出版了

Rumelhart, D., Hinton, G. & Williams, R. Learning representations by back-propagating errors. Nature 323, 533–536 (1986). https://doi.org/10.1038/323533a0

，它的重要性才得到充分认识。通过反向传播，可以使用神经网络来解决以前无法解决的问题。如今，反向传播是神经网络学习的主力军。没有它，我们将浪费时间和精力。那么，反向传播如何能够减少计算梯度所花费的时间呢？这一切都归结为在正向和反向累积模式下应用链式法则之间的计算复杂性。下面分别从前向和反向传播两个过程详细分析算法的复杂度。

https://zhuanlan.zhihu.com/p/361636579
时间复杂度分析有一个基本的法则，就是四则运算法则。

加法法则，如果算法的代码是平行增加的，那么就需要加上相应的时间复杂度。
乘法法则，如果算法的代码增加的是循环内的嵌套或者函数的嵌套，那么就需要乘上相应的时间复杂度。

预备知识

1.对节点的定义，引入了相当多的符号。

符号	含义
$l$	隐藏层的个数（输入层 $l = 0$ ，输出层 $l = L + 1$ ）
$M_{l}$	第 $l$ 层的神经元个数（输入层神经元个数 $M_{0}=d$ ，输出层神经元个数 $M_{L+1}=d'$ ）

2.明晰损失函数和成本函数的区别
损失函数表示单个样本预测值和真实值之间的差异。主要是配合反向传播使用的，为使得在反向转播中可以找到最小值，所以损失函数必须是可导的。
成本函数表示一整个数据集（m个样本）预测值和真实值之间的差异求和再取平均，比如MSE，极大似然估计。用于衡量算法在全部样本上的表现。
代价函数再加上正则项或者别的什么优化项就叫目标函数。