因为softmax中指数函数,很容易超出计算机表达的最大值,所以采用分子分母同时乘N的方法,N一般为最大值。 转载于:https://www.cnblogs.com/mdumpling/p/8094194.html