今天在运行代码过程中,在神经网络输出层设计激活函数的过程中遇到了一个十分有趣的函数softmax函数,作为处理分类问题的常用函数,有必要从代码和图像深度了解该函数,softmax存在一个溢出的问题,就是当输入的数据很大时,由于softmax函数的本质工作是在做指数函数的运算,所以回导致最终的数据无法正常输出,会报错,出现“nan”报错现象。
今天在运行代码过程中,在神经网络输出层设计激活函数的过程中遇到了一个十分有趣的函数softmax函数,作为处理分类问题的常用函数,有必要从代码和图像深度了解该函数,softmax存在一个溢出的问题,就是当输入的数据很大时,由于softmax函数的本质工作是在做指数函数的运算,所以回导致最终的数据无法正常输出,会报错,出现“nan”报错现象。