第8到12行为正向传播算法,输出一个损失函数。 (其中h为sigmod激活函数,第11行为L2损失函数) 第14到20行为反向传播算法,使用梯度下降法对权值进行优化。 注:常见的几种Activation Functions