分布式机器学习二

最新推荐文章于 2024-04-25 09:55:02 发布

zhiaoo

最新推荐文章于 2024-04-25 09:55:02 发布

阅读量184

点赞数

分类专栏：分布式机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014073556/article/details/115973234

版权

分布式机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

异步算法

MapReduce是不能实现异步算法的。异步算法比同步算法需要更多的迭代次数，但异步算法避免了同步造成的时间浪费，所示实际上异步更快一些。

server可以是多个

异步算法可以收敛

异步不需要等待，计算完成后立刻和server通信，然后立刻开始下一轮计算。

绿色部分都是通信，每次通信server都会更新参数，到t1时刻server端参数都更新8次了，三号计算出的梯度基于t0时刻计算出的，已经过时了，没用了。若server用work3的梯度来更新参数，只会让参数变得更差，所以异步算法要求work比较稳定。联邦学习就存在这种问题，work都是手机之类的设备，不稳定，所以异步不适用联邦学习。

前两两种并行梯度下降实现，一种同步用MapReduce实现，一种异步用Parameter Server实现，这两者相同点都是client, server架构，他们都有一个server来协调work的计算。

这种网络是去中心化的网络，叫Peer to Peer，点对点，这种架构没有server，所有节点都是work.

每个节点的w_i不太一样，直到最后他们才能收敛到同一个地方去。每个节点重复这四个步骤，第三步的加权平均保证了所有节点可以收敛到同一个地方。

去中心化的梯度下降，随机梯度下降，都是可以收敛的，最近几年不少论文做这方面的证明。可以看看2017年这篇文章和它的引用，以及在谷歌学术上引用它的文章。

图的连接越紧密，算法收敛越快，比如完全图，算法收敛非常快，图不是强连接，即图可以拆成两部分，则算法不会收敛。

一台机器可以多插处理器，但无法插太多，所以要用多个节点。

通信是重中之重，研究并行计算的人最关心的就是怎样通信，通信代价由多大。两种通信：共享内存、信息传递。

MapReduce用来做数据处理很好，但用来做机器学习效率并不高。异步的效率更高，更适合机器学习，现在并行训练，神经网络都是在用Parameter Server。Decentralized可以同步也可以异步，但现在理论分析基本都是同步的。去中心化的还不是太流行(不受server限制)，但受到关注越来越多。

并行计算和分布式计算界限比较模糊，机器学习的人比较喜欢分布式计算这个词，只要数据或模型被划分到多个节点上，这几个节点用message passing通信，机器学习的人就认为是分布式计算了。

------------------------------

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
分布式机器学习二

标量对向量求导，得到的梯度也是一个向量，梯度和变量w的维度一样求出的梯度是这N项的连加，梯度g(w)是w的一个函数。在不同位置上求出梯度也不一样，因为梯度跟w有关，所以并行训练时我们需要把w传来传去梯度写成g_i(w)连加，因为有n项，n个训练样本，每个g_i只与这个样本的x_i, y_i有关，与其他数据样本无关，这就时为什么做并行计算的时候可以把样本划分到多个机器上。每个机器只需要用本地的数据训练一个本地的g_i.沿着梯度方向会上升，反方向会下降。计算梯度g在w_t方向的梯...
复制链接

扫一扫

专栏目录

zhiaoo CSDN认证博客专家 CSDN认证企业博客

码龄10年

30: 原创

40万+: 周排名

5万+: 总排名

13万+: 访问

: 等级

930: 积分

59: 粉丝

119: 获赞

15: 评论

394: 收藏

私信

关注

热门文章

分类专栏

最新评论

盘点十大开源大模型
csdn_aspnet: 支持博主！热门开源大模型项目推荐：https://blog.csdn.net/hefeng_aspnet/article/details/139669116 欢迎各位小伙伴收藏、点赞、留言、评论
深度学习十大算法-快速掌握！
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
深度学习十大算法-快速掌握！
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
图灵停机问题的史上最详细描述
T-c.: 牛，寥寥几句讲的清清楚楚
图灵停机问题的史上最详细描述
Heliphilia: 很清晰

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

zhiaoo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。