2021-03-13 深度梯度压缩DGC

本文提出深度梯度压缩(DGC)技术,旨在降低分布式训练的通信带宽,尤其适用于移动设备。DGC通过动量校正、局部梯度修剪、动量因子掩蔽和热身训练,实现高达600倍的梯度压缩比,减少了ResNet-50和DeepSpeech模型的梯度大小,同时保持训练精度,有效解决了移动设备分布式训练的网络带宽问题。
摘要由CSDN通过智能技术生成

深度梯度压缩:降低分布式训练的通信带宽

文章地址:https://arxiv.org/pdf/1712.01887.pdf

本文针对移动设备分布式训练

AB:大规模分布式训练需要使用通信带宽,带宽限制了多节点训练的可伸缩性,并且需要昂贵的高带宽网络基础结构,在移动设备的分布式训练中,这会导致更高的延迟,以及间歇性的不良连接。

我们发现分布式SGD中99.9%的梯度交换是多余的,并提出了深度梯度压缩(DGC)以大大减少通信带宽。

DGC采用四种方法:动量校正,局部梯度修剪,动量因子掩蔽和热身训练。

在这些情况下,深度渐变压缩可实现从270x到600x的梯度压缩比,而不会降低精度,将ResNet-50的梯度大小从97MB减小到0.35MB,而DeepSpeech的梯度大小从488MB减小到0.74MB。这有利于移动设备的分布式训练。

 

IN:

在训练中,通过增加节点的数量并利用数据并行性可以显著减少在相同大小训练集上进行前向后的总计算时间,但是!梯度交换的成本很高。网络带宽成为了扩展分

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值