【干货书】分布式机器学习的优化算法

ac6728cf651adafcd48fd0946b117912.png

来源:专知
本文为书籍介绍,建议阅读5分钟
本书讨论了最先进的分布式机器学习随机优化算法,并分析了它们的收敛速度。

ac9cf4a85c23505c21b6241802351317.png

本书讨论了最先进的分布式机器学习随机优化算法,并分析了它们的收敛速度。本书首先介绍了随机梯度下降(stochastic gradient descent, SGD)及其分布式版本同步梯度下降(synchronous gradient descent, synchronous SGD),其中计算梯度的任务被划分到几个工作节点上。讨论了几种提高同步SGD可扩展性和通信效率的算法,如异步SGD、局部更新SGD、量化和稀疏化SGD和去中心化SGD。对于这些算法,本书会分析它们的误差和迭代收敛性,以及每次迭代的运行时间。作者指出,这些减少通信或同步延迟的策略都在错误和运行时之间进行了基本的权衡。

随机梯度下降是当今有监督机器学习训练的支柱。经典的SGD被设计为运行在单个计算节点上,其误差收敛与迭代次数的关系在优化和学习理论文献中得到了广泛的分析和改进。然而,由于今天使用了大量的训练数据集和模型,在单个节点上运行SGD可能会非常慢。这需要SGD的分布式实现,其中梯度计算和聚合被划分到多个工作节点上。虽然并行提高了每次迭代处理的数据量,但它使SGD暴露于由计算基础设施的变化引起的不可预测的节点速度减慢和通信延迟。因此,迫切需要使分布式SGD快速,并对系统变化具有鲁棒性。在本书中,我们将讨论大规模机器学习中最先进的算法,这些算法通过异步聚合、局部更新、量化和去中心化共识等技术来提高分布式SGD的可扩展性。这些方法以不同的方式减少通信成本:异步聚合允许通信和局部计算重叠,局部更新减少通信频率从而将通信延迟分摊到几个迭代中,量化和稀疏化方法减少了每次迭代的通信时间,去中心化共识通过允许网络拓扑中的不同节点训练模型并与邻居并行平均模型,从而减少了空间通信。

对于本书介绍的每一个分布式SGD算法,本书都对其收敛性进行了分析。然而,与传统的优化文献不同,我们不仅关注误差与迭代的收敛性,或迭代的复杂性。在分布式实现中,由于同步和通信协议会影响每次迭代所需的时间,因此研究误差与wallclock时间的收敛性是很重要的。我们将计算和通信延迟建模为随机变量,并确定本书中介绍的各种分布式SGD算法每次迭代的预期wallclock运行时间。通过运行时分析和误差收敛分析,可以得到不同算法收敛速度的真实比较。

https://link.springer.com/book/10.1007/978-3-031-19067-4?source=shoppingads&locale=en-jp

134f629447404c796e0f6d88ef7fcf0d.png

18c9a2ec7bbeac0a2634304ce9bdda84.png

434797aaa058eddbb7d9038dab9afab8.png

30fa7fab92e10b20057d4d4b3205415f.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大数据的发展已经引领了对能够学习包含数百万至数十亿参数的复杂模型的机器学习系统的新需求,以保证足够的能力来消化海量的数据集,提供强大的预测分析(如高维潜特征、中介表示和决策功能)。为了在这样的尺度上,在成百上千台的分布式机器集群中运行机器学习算法,关键往往是要投入显著的工程性的努力——有人可能会问,这样的工程是否还属于机器学习的研究领域?考虑到如此"大"的机器学习系统可以极大地从根植于机器学习的统计和算法的理解中受益——因此,机器学习的研究人员应该不会回避这样的系统设计——我们讨论了一系列从我们近来对工程尺度的机器学习解决方案的研究中提炼的原则和策略。这些原则和策略从机器学习的应用连续跨越到它的工程和理论研究,以及大型机器学习的系统和架构的发展,目标是了解如何使其有效、广泛地适用,并以收敛和缩放保证支持。它们关注的是机器学习研究传统上注意较少的四个关键问题:一个机器学习程序怎样能分布到一个集群中去?机器学习计算怎样能通过机器间的交流连接起来?这样的交流是如何被执行的?机器间应该交流的内容是什么?通过揭示机器学习程序所独有的,而非常见于传统计算机程序中的基础性的统计和算法上的特点,并通过剖析成功案例,以揭示我们如何利用这些原则来同时设计和开发高性能的分布式机器学习软件以及通用的机器学习框架,我们为机器学习的研究人员和从业者提供了进一步塑造并扩大机器学习与系统之间的领域的机会。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值