一、softmax介绍
定义:将si替换成aj
应用:分类问题结果的归一化处理
二、sofmax求导
C为交叉熵损失函数:
导数:
为什么要将下角标通过j和i区分呢?
如图,在这种情况下,其他类别预测的y值也会 影响softmax的结果。
①如果i=j:ai * (1 - ai)
②如果i≠j:-ai * aj
与交叉熵损失函数结合结果为:
一、softmax介绍
定义:将si替换成aj
应用:分类问题结果的归一化处理
二、sofmax求导
C为交叉熵损失函数:
导数:
为什么要将下角标通过j和i区分呢?
如图,在这种情况下,其他类别预测的y值也会 影响softmax的结果。
①如果i=j:ai * (1 - ai)
②如果i≠j:-ai * aj
与交叉熵损失函数结合结果为: