1 梯度提升 vs 梯度下降 梯度下降更新的是参数。 梯度提升更新的是函数。 比如 l o s s = f ( x ) = x 2 loss=f(x)=x^2 loss=f(x)=x2 如果是梯度下降,每次迭代就会更新 x , x n = x n − 1 + δ n x, x_n=x_{n-1}+\delta_n x,