Pytorch Note16 优化算法2 动量法(Momentum)
文章目录
全部笔记的汇总贴: Pytorch Note 快乐星球
动量法(Momentum)
SGD 在 ravines 的情况下容易被困住, ravines 就是曲面的一个方向比另一个方向更陡,这时 SGD 会发生震荡而迟迟不能接近极小值:
Momentum
考虑一个二维输入, [ x 1 , x 2 ] [x_1, x_2]
SGD 在 ravines 的情况下容易被困住, ravines 就是曲面的一个方向比另一个方向更陡,这时 SGD 会发生震荡而迟迟不能接近极小值:
考虑一个二维输入, [ x 1 , x 2 ] [x_1, x_2]