1.动量项:按指数加权,线性缩放。
2.包括偏置修正,修正了一阶矩估计和二阶矩估计。
3.二阶矩,产生动态的学习率,自适应,按照逐维度调整,每个维度都对应一个学习率
4.对超参数对选择比较鲁棒。
学习率自适应对动量法
公式:
pytorch中对代码:
按照模型结构,逐层循环的方式,进行的更新
一阶矩和二阶矩的计算:
一阶和二阶修正项的计算,逐元素操作乘和除:
1.动量项:按指数加权,线性缩放。
2.包括偏置修正,修正了一阶矩估计和二阶矩估计。
3.二阶矩,产生动态的学习率,自适应,按照逐维度调整,每个维度都对应一个学习率
4.对超参数对选择比较鲁棒。
学习率自适应对动量法
公式:
pytorch中对代码:
按照模型结构,逐层循环的方式,进行的更新
一阶矩和二阶矩的计算:
一阶和二阶修正项的计算,逐元素操作乘和除: