神经网络与深度学习笔记——代价函数，规范化，过拟合

最新推荐文章于 2022-11-11 20:28:58 发布

刘爱然

最新推荐文章于 2022-11-11 20:28:58 发布

阅读量1k

点赞数 1

分类专栏：神经网络与机器学习笔记文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/weixin_42194139/article/details/105004882

版权

本文深入探讨神经网络中的学习方法，重点讲解了交叉熵代价函数的作用和推导，以及如何通过规范化来缓解过拟合问题。讨论了softmax函数、L2规范化和dropout等技术，并介绍了权重初始化和超参数选择策略。

摘要由CSDN通过智能技术生成

神经网络与深度学习笔记系列一共有五个专题，分别是
第一章使用神经网络识别手写数字——梯度下降算法是什么。主要介绍了神经网络的基础例如感知器激活函数等概念，最主要介绍了梯度下降算法。
第二章反向传播算法如何工作——反向传播算法原理。主要介绍了反向传播算法的工作原理。

第三章改变神经网络的学习方法——代价函数，规范化，过拟合。主要介绍了不同的代价函数，以及规范化等对传统代价函数的改造。

第四章深度神经网络为何难以训练——梯度消失和爆炸。主要介绍了梯度消失问题和梯度爆炸问题。

第三章改进神经网络的学习方法

3.1交叉熵代价函数

类似于人类试错过程，我们希望神经网络在预测的最终结果和我们想要的结果差距越大时，神经网络对权重和偏置的改变也越大，当慢慢接近真实结果时，改变变小。但是事实上神经网络的学习却是非常缓慢的，原因是我们采用的sigmoid函数两端变得非常平，代价函数对权重和偏置的偏导数变得很小，所以导致了学习缓慢。我们可以通过使用交叉熵代价函数在替换二次代价函数，改善这个问题。