1. 为什么要用交叉熵损失代替平方损失 为什么不用二次方代价函数 权值和偏置的偏导数为 求导过程 偏导数受激活函数的导数影响,sigmoid函数导数在输出接近0和1时非常小,会导致一些实例在刚开始训练时学习得非常慢。 为什么要用交叉熵