Optimization algorithm summary | 几种深度学习优化算法表格、思维导图总结对比
嗨,好久不见,我是error,废话不多说,直接上总结。
因为目前大多数深度学习都使用了Keras和Tensorflow框架,很多时候我们都只存在如何选择哪种算法的问题,因此这里着重对比各个算法,而不做详细的解释说明算法的原理问题。如果感兴趣算法的原理,可以上吴恩达老师的课,老师在课上都有详细的说明。
思维导图
借用了当时上课时的笔记,主要用于复习与回顾。
表格对比
此表格是我参考了网上许多资料后制作出来的,感谢网上各位大神的经验分享!
优点 | 缺点 | |
---|---|---|
Batch Gradient Descent | 若为凸函数则必定能收敛到全局最优 | 迭代慢计算大不允许在线更新增添模型 |
Stochastic Gradient Descent | 速度快,可随时添加新数据 | 容易困在局部最优 |
Mini-batch G |