当softmax作为中间层的激活函数时,会导致小数相乘,使得效果很不好,所以softmax一般和交叉熵损失函数一起使用,放在最后一层。
Softmax和交叉熵损失函数反向传播推导
最新推荐文章于 2024-07-20 16:13:15 发布
当softmax作为中间层的激活函数时,会导致小数相乘,使得效果很不好,所以softmax一般和交叉熵损失函数一起使用,放在最后一层。