五、优化算法、损失函数、优化器的搭配建议

最新推荐文章于 2025-10-25 20:25:37 发布

原创最新推荐文章于 2025-10-25 20:25:37 发布 · 597 阅读

CC 4.0 BY-SA版权

文章标签：

9 篇文章

订阅专栏

前言

Momentum（带动量的梯度下降）：
- 常与 ReLU 激活函数和 CrossEntropyLoss（分类任务）搭配使用。
Adam（Adaptive Moment Estimation）：
- ReLU 激活函数 + CrossEntropyLoss（分类任务）或 MSELoss（回归任务）。
- Adam 适用于大多数激活函数和损失函数，尤其适合用于复杂网络。
RMSprop：
- ReLU 激活函数 + CrossEntropyLoss（分类任务）或 MSELoss（回归任务）。
Adagrad：
- 常与 ReLU 激活函数和 CrossEntropyLoss（分类任务）或 MSELoss（回归任务）搭配。

分类任务：
- 二分类（2类）：
  - 激活函数：sigmoid
  - 损失函数：BCEWithLogitsLoss 或 BCELoss
  - 优化器：SGD、Adam、RMSprop
- 多分类（N类）：
  - 激活函数：softmax
  - 损失函数：CrossEntropyLoss
  - 优化器：SGD、Adam、RMSprop
回归任务：
- 激活函数：通常不使用激活函数或使用 ReLU（对正值的预测）
- 损失函数：MSELoss（均方误差损失）
- 优化器：SGD、Adam、RMSprop
多标签分类任务：
- 激活函数：sigmoid（每个标签独立）
- 损失函数：BCEWithLogitsLoss
- 优化器：Adam、SGD