梯度下降 选一个初始的参数计算偏微分更新参数 为了更有效率的计算梯度,我们用反向传播。 反向传播(backpropagation) 链式法则 前向传播(forward pass ) 反向传播(backward pass) 总结