训练一个 Softmax 分类器(Training a Softmax classifier)
上一个笔记中我们学习了Softmax层和Softmax激活函数,在这个笔记中,你将更深入地了解Softmax分类,并学习如何训练一个使用了Softmax层的模型。
![306674b2e7bcdbd4afc28d23ad01ae1f.png](https://i-blog.csdnimg.cn/blog_migrate/409a34414602528d8a6d0307cd44cfac.jpeg)
回忆一下我们之前举的的例子,输出层计算出的z^([l])如下,
![5e70a8ed453a0732d11221dab851ca93.png](https://i-blog.csdnimg.cn/blog_migrate/d36fc9521e9605c2f02fee04acb8a3d1.jpeg)
我们有四个分类C=4,z^([l])可以是4×1维向量,我们计算了临时变量t
![542b9dee6cc3ad393404daf472befd7f.png](https://i-blog.csdnimg.cn/blog_migrate/2c29ce329b436d6058992c1c89634bdd.jpeg)
对元素进行幂运算,最后如果你的输出层的激活函数g^([L]) ()是Softmax激活函数,那么输出就会是这样的:
![fffc036614d8bd53d3c6a05c5834c7da.png](https://i-blog.csdnimg.cn/blog_migrate/c5b4bedbbb0b6cb24e718eb547d51fc4.jpeg)
简单来说就是用临时变量t将它归一化,使总和为1,于是这就变成了a^([L]),你注意到向量z中,最大的元素是5,而最大的概率也就是第一种概率。
![985784ba638555c734c822ea34e476d3.png](https://i-blog.csdnimg.cn/blog_migrate/90c982d84baeafe6ae9c5c7d5b039d20.jpeg)
Softmax这个名称的来源是与所谓hardmax对比,hardmax会把向量z变成这个向量