1.计算误差
w11(1 )
第一个1:上层的第几个
第二个1:本层的第几个
(1)代表第几层
注意第二层并没有写激活函数
计算多类损失时最后一层激活函数一般统一用softmax
softmax 处理后所有输出节点概率和为1
sigmoid不满足任何分布
多分类问题
猫 狗 (输出只可能归于一个类别)
二分类问题
人类 男人(输出可能归于多个类别)
通过相应公式得到误差
2.误差的反向传播
以求w11(2)的误差梯度进行讲解
求w11(2)的误差梯度也就是loss对其求偏导
求导后也就相当于把误差反向传播到了每一个节点,得到了每个点的损失梯度
更新后的权重如上图右下角
优化器是为了使网络更快的收敛