机器学习理论——Optimizaztion

最新推荐文章于 2024-06-08 09:29:07 发布

KL-22b

最新推荐文章于 2024-06-08 09:29:07 发布

阅读量223

点赞数

分类专栏： # 机器学习理论文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zoka11/article/details/119697394

版权

机器学习理论专栏收录该内容

2 篇文章 0 订阅

订阅专栏

这篇文章是学习李宏毅老师2021春季课程，关于Optimization的笔记。
课程链接：https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.html

SGD
向着gradient的反方向移动。
SGD with Momentum（SGDM）
在SGD的基础上，定义了一个向量momentum，把每个time step的gradient进行累加。
Adagrad
可以根据历史gradient的和，自动调整学习率。
RMSProp
借用了类似momentum的算法，可确保这个optimization不会因为前几步的gradient太大就停下来。
Adam（SGDM + RMSProp）

Adam vs SGDM

Train
Validation
Test
1. Test Accurarcy for ResNet-34

2. L1: 1-Layer LSTM
Summary
Adam: fast training, large generalization gap, unstable
SGDM: stabel, little generalization gap, better convergence(收敛)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习理论——Optimizaztion

这篇文章是学习李宏毅老师2021春季课程，关于Optimization的笔记。课程链接：https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.htmlSGD向着gradient的反方向移动。SGD with Momentum（SGDM）在SGD的基础上，定义了一个向量momentum，把每个time step的gradient进行累加。Adagrad可以根据历史gradient的和，自动调整学习率。RMSProp借用了类似
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。