一.分类方法
原本是接近一个数,,现在是接近一个向量并且分为几个class。
classification还要经过一个处理:softmax,他的主要功能就是把y中的任何数值移动到0-1之间。
softmax的运作方式:
先把所有算出来的y全部取e,再除以所有取e的y的和,即为sofemax后的y。
二.loss of classification
有两个计算e的方法,但是cross-entropy更常用,很多时候是和softmax绑在一起的。
为什么softmax好:
如果同时在左上角大的loss开始训练,希望可以走到左下角小的loss,那么交叉熵在左上角有斜率可以更好的训练优化,使用交叉熵可以简化优化的过程。