深度学习常用的激活函数、优化器? 各自的优缺点

最新推荐文章于 2024-08-25 09:53:04 发布

学乐乐

最新推荐文章于 2024-08-25 09:53:04 发布

阅读量81

点赞数

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52806062/article/details/134058950

版权

深度学习常用的激活函数有哪些?

1⃣Sigmoid函数: f(x) = 1 /(1 + exp(-x))
2⃣ReLU函数: fx) = max(0,x)
3⃣Leaky ReLU函数: f(x) = max(0.01x,x)
4⃣Tanh函数: f(x) = (exp(x) - exp(-x)) /(exp(x)+exp(-x))
5⃣Softmax函数: f(x i) = exp(x i) / sum(exp(x_j))
6⃣Swish函数: f(x) = x* sigmoid(x)
7⃣Softplus函数: f ( x ) =In ( 1 + exp x ）

深度学习有哪些优化器? 各自的优缺点?

1⃣Stochastic Gradient Descent ( SGD ): 迭代速度快，但是容易陷入局部解
2⃣SGD with momentum: 加速SGD，但可能跳出最优解
3⃣AdaGrad: 考虑历史梯度的数据，动态调整参数
4⃣RMSprop: 相比AdaGrad增加了衰减因子，提高计算速度
5⃣Adam: 结合动量和RMSProp优点，使用较多

6AdamW: Adam结合weight decay，提高计算速度，通常用此方法

梯度消失和梯度爆炸如何理解? 怎么解决?

梯度消失: 梯度变得趋近于零，导致网络无法更新权重
梯度爆炸: 梯度变得非常大，导致网络的权重更新失控

解决梯度消失方法:

1⃣恰当的激活函数: ReLU、LeakyReLU
2⃣使用归一化方法，Batch Normalization
3⃣使用残差方法: Residual Connection

解决梯度爆炸方法:

1⃣梯度裁剪，限制梯度范围
2⃣使用归一化方法，Batch Normalization
3⃣合理的权重初始化，如Xavier方法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习常用的激活函数、优化器? 各自的优缺点

4⃣Tanh函数: f(x) = (exp(x) - exp(-x)) /(exp(x)+exp(-x))5⃣Softmax函数: f(x i) = exp(x i) / sum(exp(x_j))7⃣Softplus函数: f ( x ) =In ( 1 + exp x ）1⃣Sigmoid函数: f(x) = 1 /(1 + exp(-x))3⃣Leaky ReLU函数: f(x) = max(0.01x,x)6⃣Swish函数: f(x) = x* sigmoid(x)
复制链接

扫一扫

学乐乐 CSDN认证博客专家 CSDN认证企业博客

码龄4年

37: 原创

52万+: 周排名

3万+: 总排名

1万+: 访问

: 等级

622: 积分

177: 粉丝

228: 获赞

7: 评论

242: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇

最新评论

论文格式全攻略：三线表、跨页处理、页眉页脚设置及图/表目录自动生成
CSDN-Ada助手: 恭喜您撰写了第18篇博客《论文格式总结》，对于学术写作来说，了解论文格式的重要性不言而喻。希望您能继续坚持创作，分享更多关于学术写作的心得体会。或许下一步可以探讨一些具体的写作技巧，比如如何提高论文的可读性或者如何引用文献更准确地等方面的内容，期待您的下一篇作品！
GCRec笔记--Graph-Augmented Capsule Network forNext-Item Recommendation
CSDN-Ada助手: 恭喜您撰写第15篇博客！标题中的“GCRec笔记--Graph-Augmented Capsule Network for Next-Item Recommendation”听起来非常专业和引人入胜。您对这个主题的深入探讨无疑为读者提供了宝贵的见解。不过，我想提供一些建议，以便您在未来的创作中更上一层楼。或许您可以考虑添加一些具体的实例或案例分析，以帮助读者更好地理解和应用您所介绍的Graph-Augmented Capsule Network。此外，您还可以探索一些可能的改进或扩展，以便读者能够了解该方法在其他领域的应用潜力。期待着您下一篇博客的发布，再次恭喜您！
MMMLP笔记--Multi-modal Multilayer Perceptron for Sequential Recommendations
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题“MMMLP笔记--Multi-modal Multilayer Perceptron for Sequential Recommendations”非常吸引人。您对这个主题的深入探讨令人印象深刻。我希望您能继续保持创作的热情和努力。对于下一步的创作建议，我谦虚地建议您可以考虑探索更多与多模态多层感知器在顺序推荐中相关的领域或应用。可能深入研究其在实际场景下的表现，或者与其他相关算法进行比较分析，都会为读者提供更全面的视角。期待您未来更多精彩的分享！
FinalMLP笔记
CSDN-Ada助手: 恭喜您写下了第14篇博客，“FinalMLP笔记”！持续创作是非常不易的，您已经取得了很大的进步。对于下一步的创作建议，我建议您可以尝试更深入地探讨MLP的应用场景，或者分享一些实际案例，让读者更容易理解和应用您所分享的知识。谦虚地说，希望我的建议能对您有所帮助。继续加油！
LightGCN笔记
CSDN-Ada助手: “恭喜你写了第11篇博客《LightGCN笔记》，真的很不容易能够坚持写作，希望你能够继续保持这样的创作热情。不过，我觉得你可以尝试在下一篇博客中加入一些实际案例或者个人见解，这样可以让读者更加深入地了解你对LightGCN的理解。加油！”

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。