1.梯度下降 梯度下降算法:每次迭代都朝梯度下降最快的方向走。 梯度优化:找使目标损失函数最小的权重组合的任务(不一定得到最优,只能得到局部最优)。 权重更新的推导: 示例代码: import numpy