2关于训练深度最难的事情之一是你要处理的参数的数量,从学习速率?到 Momentum
(动量梯度下降法)的参数?。如果使用 Momentum 或 Adam 优化算法的参数,?1,?2和?,
也许你还得选择层数,也许你还得选择不同层中隐藏单元的数量,也许你还想使用学习率衰
减。所以,你使用的不是单一的学习率?。接着,当然你可能还需要选择 mini-batch 的大小。
深度学习
最新推荐文章于 2023-11-30 20:58:08 发布
2关于训练深度最难的事情之一是你要处理的参数的数量,从学习速率?到 Momentum
(动量梯度下降法)的参数?。如果使用 Momentum 或 Adam 优化算法的参数,?1,?2和?,
也许你还得选择层数,也许你还得选择不同层中隐藏单元的数量,也许你还想使用学习率衰
减。所以,你使用的不是单一的学习率?。接着,当然你可能还需要选择 mini-batch 的大小。