** 梯度下降 关于梯度下降的详细讲解在我的《线性回归》中 超链接如下:梯度下降 当然可以预见的是神经网络的梯度下降是比较繁琐的,因为代价函数的参数是非常多的,往往我们获得的是局部最优解,当然因为大量数据的存在,这个局部最优解也足以够用