3.1 调试处理
在训练神经网络模型时,超参数的选取是一个非常麻烦且费时的过程。主要的超参数包括:
1.α 1. α 学习率
2.β1 momentum 2. β 1 m o m e n t u m 梯度下降法参数
3.#hiddien units 3. # h i d d i e n u n i t s 隐藏层单元数
4.mini−batch size 4. m i n i − b a t c h s i z e
5.#layers 5. # l a y e r s 模型层数
6.learning rate decay 6. l e a r n i n g r a t e d e c a y 学习率衰减指数
7.β1,β2,ϵ Adam 7. β 1 , β 2 , ϵ A d a m 参数
其中 α α 学习率是最重要的超参数,其次是 β1 momentum β 1 m o m e n t u m 、 #hiddien units # h i d d i e n u n i t s 和 mini−batch size m i n i − b a t c h s i z e ,然后是 #layers # l a y e r s 和 learning rate decay
吴恩达《深度学习工程师》Part2.Week3 超参数调试、Batch正则化及程序框架
最新推荐文章于 2024-02-18 22:04:31 发布