2.4梯度下降法 成本函数J衡量了参数w和b在训练集上的效果 。要做的是找到参数w和b使得J最小:用初始值初始化w和b 梯度下降,从初始点朝最陡下降方向走,最后收敛到全局最优点梯度下降法的细节: 忽略b的一维曲线,重复更新w,alpfa表示学习率,dw表示导数变量名(写代码时)