整理自牛客 在梯度下降法中,为什么梯度的负方向是函数下降最快的方向?为什么引入Relu呢?softmax,softmax loss和cross entropybias的作用推导BP算法Inverted DropoutBN:Internal Covariate ShiftInception v1 - v4focal losssoftnmsMSE缺点