An overview of gradient descent optimization algorithms 怎么选取训练神经网络时的Batch size? PyTorch学习笔记(9)——nn.Conv2d和其中的padding策略 机器学习大牛最常用的5个回归损失函数,你知道几个? https://www.jiqizhixin.com/articles/2018-06-21-3 回归模型常见的损失函数 L1 vs. L2 Loss function