[深度之眼机器学习训练营第四期]大规模机器学习

最新推荐文章于 2024-01-26 15:40:35 发布

nudt_oys

最新推荐文章于 2024-01-26 15:40:35 发布

阅读量323

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_26658823/article/details/104874681

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

这一节主要讲了一些适用于大规模机器学习的算法及策略，并比较了梯度下降、随机梯度下降和小批量梯度下降的优劣。目前来说，大规模机器学习中用的最多的还是小批量梯度下降，毕竟它在执行效率和性能之间达到了一个平衡。当然，对于小批量梯度下降来说，如何选择合适的批量大小又是一个值得深思的问题。

梯度下降

$\begin{aligned} &\text{Repeat}\{\\ &\quad\quad\Theta_{t+1} := \Theta_t - \alpha\frac{1}{n}\sum_{i=1}^n\nabla\text{cost}\left(f(x^{(i)};\Theta_t),y^{(i)}\right)\\ &\} \end{aligned}$

随机梯度下降

$\begin{aligned} &\text{Repeat}\{\\ &\quad\quad\text{Shuffer training dataset randomly}\\ &\quad\quad \text{Select }\textbf{one}\text{ example from training dataset}\\ &\quad\quad\Theta_{t+1} := \Theta_t - \alpha\nabla\text{cost}\left(f(x^{(i)};\Theta_t),y^{(i)}\right)\\ &\} \end{aligned}$

小批量梯度下降

$\begin{aligned} &\text{Repeat}\{\\ &\quad\quad\text{Shuffer training data randomly}\\ &\quad\quad\text{Select }b\text{ examples from training dataset}\\ &\quad\quad\Theta_{t+1} := \Theta_t - \alpha\frac{1}{b}\sum_{i=1}^b\nabla\text{cost}\left(f(x^{(i)};\Theta_t),y^{(i)}\right)\\ &\} \end{aligned}$
后面介绍了分布式机器学习中的Map-Reduce方法，其实现阶段（2020年）常用的方法还是数据并行和模型并行这两种。主要使用的架构包括参数服务器以及一些环状架构，这里就不作过多介绍了。

nudt_oys

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[深度之眼机器学习训练营第四期]大规模机器学习

这一节主要讲了一些适用于大规模机器学习的算法及策略，并比较了梯度下降、随机梯度下降和小批量梯度下降的优劣。目前来说，大规模机器学习中用的最多的还是小批量梯度下降，毕竟它在执行效率和性能之间达到了一个平衡。当然，对于小批量梯度下降来说，如何选择合适的批量大小又是一个值得深思的问题。梯度下降Repeat{Θt+1:=Θt−α1n∑i=1n∇cost(f(x(i);Θt),y(i))}\begin{...
复制链接

扫一扫

专栏目录