《Neural Network and Deep Learning》学习笔记-hyper-parameters

最新推荐文章于 2024-08-04 00:22:50 发布

tina_ttl

最新推荐文章于 2024-08-04 00:22:50 发布

阅读量5.7k

点赞数 2

分类专栏：深度学习_deep learning 文章标签：深度学习参数选取

本文链接：https://blog.csdn.net/tina_ttl/article/details/51604125

版权

本文是《Neural Network and Deep Learning》第三章的学习笔记，主要探讨了超参数选择的重要性，尤其是学习率的影响。通过实例展示了学习率如何影响网络性能，提出了一种逐步调整学习率的方法。此外，还提及了epoch、正则化参数λ和mini-batch size的选取策略。

摘要由CSDN通过智能技术生成

本系列笔记为《Neural Network and Deep Learning》学习笔记

本系列笔记汇总
各种待续中……
第一章
第二章
第三章 Improving the way neural networks learn
3.1 交叉熵代价函数
3.2 正则化方法
3.3 权值初始化
3.4 hyper-parameters选取
3.5 一些其他技术
第四章可视化方式证明神经网络可以近似任意函数
第五章 Why are deep neural networks hard to train?
5.1 引言
5.2 什么是梯度消失问题
5.3 什么引起了梯度消失？深层网络中的梯度不稳定问题
5.4 更加复杂的深度网络中的不稳定梯度
5.5 深度学习中的其他障碍
第六章深度学习

本文为《Neural Network and Deep Learning》第三章Improving the way neural networks learn：How to choose a neural network’s hyper-parameters(如何选择神经网络中的混合参数)部分的学习笔记；
注：不知道hyper-parameters的正确译法是什么，暂且按照字面意思，称其为混合参数

本笔记目录

1 引言
2Broad strategy
3Learning rate学习率
4epoch
5正则化参数lambda的选取
6mini-batch size的选取
7自动化技术自动化选择hyper-parameters

3.1 引言

在利用神经网络解决实际问题时，hyper-parameters的选择其实是一个比较困难的工作，并且，当hyper-parameters选择不恰当时，会对网络的性能造成非常大的影响。所有，有效的选择hyper-parameters是非常重要的！本节只是讲述hyper-parameters的一些基本问题，实际中要复杂许多。