计算t时刻损失函数关于当前参数的梯度=对参数的偏导计算t时刻一阶动量和二阶动量计算t时刻下降梯度计算t+1时刻参数 adam优化器 修正项 修正项 sgd优化器 sgdm优化器 vt=1 adagrad优化器 此为开始到结束 梯度平方的累计和 rmsprop优化器