吴恩达学习-深层神经网络

最新推荐文章于 2024-07-27 17:26:39 发布

秋风05

最新推荐文章于 2024-07-27 17:26:39 发布

阅读量1k

点赞数 1

分类专栏：机器学习文章标签：神经网络深度学习算法

本文链接：https://blog.csdn.net/hdg34jk/article/details/78759195

版权

深度学习因其在解决局部最优解问题上的优势而备受青睐，尤其是深层神经网络中，陷入局部最优解的概率极小。吴恩达教授通过直观的解释说明，每一层神经网络都在逐步构建更复杂的特征，例如在人脸识别中从边缘到器官再到人脸的识别。前向传播和成本函数在深度学习中保持了与浅层神经网络类似的形式，但涉及更多参数。反向传播则需要逐层优化参数，初始化参数在深度学习中尤为重要，错误的初始化可能导致梯度消失或爆炸。代码实现过程中，一个小错误可能导致大问题，因此编程时需要格外细心。

摘要由CSDN通过智能技术生成

深度学习是指神经网络包含了很多层的隐层，比如说10层20层这样，有些问题用浅层神经网络不能得到很好的优化，只能通过深层神经网络优化，这是因为深层神经网络有其独特的优势，下面我们就先介绍深层神经网络的优势。

1.深层神经网络的优势

1.深层神经网络的一大优势就是优化算法的局部最优解问题

这里写图片描述

之前训练浅层神经网络时，经常会陷入局部最优解，而无法找到全局最优解，如下图所示（图来自吴恩达老师讲义）。

这里写图片描述

这种问题出现在深度学习网络的概率非常小，我们假设深度神经网络中有n个参数，每个参数在某点取得极小值的概率为p，则所有参数在同一点取得极小值的概率为p的n次方，这个概率是相当小的。在深度学习里，会经常出现的是鞍点，如下图所示（图来自吴恩达老师讲义）：

这里写图片描述

鞍点处的梯度为0，所有在鞍点时，同样会被困住。但是困在鞍点并不容易发生，只是存在一定的概率。可怕的是在处于马鞍面上时，梯度接近于0，这时候下降速度将会非常缓慢。所幸的是已经有很多方法加快收敛速度（比如mini-batch、momentum、Adam等），从而避免这种情况的发生。所以，在深度学习中，不很在意局部最优解问题，而会在意加快收敛速度问题。

2.深度学习为什么会奏效
吴老师给了一个直观的解释，如下图（图来自吴恩达老师讲义），用深度学习做人脸时，第一层节点可能就是做简单的边缘检测，第二层将第一层的结果组合，出来简单的器官，比如眼睛、眉毛等，第三层再将这些器官组合，一直到最后一层。每走一层，都会更加复杂，最后组合出人脸的样子。

这里写图片描述