如上文所述, 如果我们使用均方误差来考量学习误差 C=12n∑x||y(x)−aL(x)||2 则有 ∂C∂w=(a−y)σ′(z)x ∂C∂b=(a−y)σ′(z) Sigmoid 函数的曲线大致如下图: 当神经元的输出接近 0