基于深度强化学习的联邦学习客户选择

【摘  要】联邦学习是一种具有隐私保护的机器学习范式,它使各个客户在本地进行训练,只上传本地更新而不泄漏本地数据,最终实现合作训练全局模型。由于客户数量庞大,而通信资源有限,因此每次只能选择一部分客户执行聚合,但在典型的联邦学习场景中,不同客户之间表现出较大的异构性,如数据分布、硬件配置、通信状况等,在每一轮中随机采样可能无法有效利用各个客户的本地更新,导致模型收敛速度减慢、模型性能变差等。针对客户的数据质量以及通信质量的差异性,提出了一种基于双重延时深度确定性策略梯度算法(TD3)的客户选择算法,通过强化学习方法动态选择客户设备参与聚合,加速全局模型的收敛。在公开数据集上进行了大量的实验,结果表明,在考虑客户数据质量以及上行信道状况差异情况下,所提出的客户选择方法相比于随机选择以及通信贪婪选择,联邦学习效果更加鲁棒,且最终收敛的识别准确率更高。 

【关键词】联邦学习;深度强化学习;客户选择

0   引言

近年来,随着信息技术的不断发展,移动智能设备的数量呈现爆发式增长,导致了海量数据的产生,这些数据对于机器学习训练模型具有重大价值[1-2]。传统的机器学习收集数据至中心处理器进行训练及分析[3],然而,由于数据量过大,集中式的训练会产生巨大的数据传输成本;并且随着人们对信息安全的关注度不断提高,个人用户对于数据隐私保护的需求愈加强烈,集中处理可能会出现隐私泄露问题[4]。同时,由于企业之间的相互竞争,数据往往以孤岛形式存在,无法直接利用[5]。

为了解决上述问题,联

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宋罗世家技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值