Softmax 函数的主要功能是将各个类别的“打分”转化成合理的概率值。
例如,一个样本可能属于三个类别:第一个类别的打分为 a,第二个类别的打分为 b,第三个类别的打分为 c 。 打分越高代表属于这个类别的概率越高,但是打分本身不代表概率,因为打分的值可以是负数,也可以很大,但概率要求僵必须在 0~1 ,并且三类的概率加起来应该等于 l 。
那么,如何将(a, b, c)转换成合理的概率值呢?方法就是使用 Softmax 函数。
例如,对(a, b, c)使用 Softmax 函数后,相应的值会变成( ,
,
),也就是说,第一类的概率可以用
表示 ,第二类的概率可以用
表示,第三类的概率可以用
表示 。显然 ,这三个数值都在 0~l 之间,并且加起来正好等于 1 ,是合理的概率表示 。
转自《21个项目玩转深度学习》