先占坑,以后补全。 今天遇到softmax_loss Layer的问题,在网上找到Chiyuan Zhang学长的这篇文章。终于明白了为什么在计算中它会减去最大的一个值。有时间要自己搞清楚, 再写下来。