softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内。假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值:
如下图表示:
softmax直白来说就是将原来输出是3,1,-3通过softmax函数一作用,就映射成为(0,1)的值。我们就可以选取概率最大(也就是值对应最大的)结点,作为我们的预测目标。
当我们对分类的Loss进行改进的时候,我们要通过梯度下降,每次优化一个step大小的梯度。求Loss对每个权重矩阵的偏导,应用链式法则:
z4 = w41*o1+w42*o2+w43*o3 (o1,o2,o3代表是结点1,2,3的输入, z4代表结点的输出)
(z4代