数据划分-训练/验证/测试集 模型估计-偏差/方差 正则化(regularization) 正则化是在成本函数中加入一个正则化项,惩罚模型的复杂度。正则化可以用于解决低方差的问题。 dropout 正则化 梯度消失和梯度爆炸 batch梯度下降法 Mini-Batch梯度下降法 指数平均加权 动量梯度下降法 RMSProp算法 Batch Normalization