论文阅读-DRL求解Edge Learning中的激励机制

这篇INFOCOM2020论文探讨了使用深度强化学习(DRL)方法设计有效的边缘学习激励机制。通过定义损失函数和分布式数据集的全局损失,研究了如何最大化学习效果。论文考虑了边缘节点(ENs)的CPU周期数、本地训练时间、通讯模型以及资源更新的动态过程,同时引入了效用函数来衡量ENs的收益和成本。
摘要由CSDN通过智能技术生成

INFOCOM2020论文:An Incentive Mechanism Design for Efficient Edge Learning by Deep Reinforcement Learning Approach

系统模型

define:

  • 训练样本 j j j中包含:vector x j x_j xj is the input of ML model; scalar y j y_j yj is the output of ML model.
  • 对于每个训练样本 j j j有定义在参数向量ω上的损失函数
  • 所有的训练数据对表示为: { x j , y j } j ∈ D n \{x_j, y_j\}_{j \in \mathcal{D}_n} { xj,yj}jDn

损失函数表示表示训练数据与模型的误差。模型学习的过程是在训练样本上最小化损失函数。

  • 训练样本 j j j的损失函数 f j ( w ) f_j(w) fj(w)
  • ENs标识为 N = { 1 , 2 , ⋯   , N } \mathcal{N}=\{1,2, \cdots, N\} N={ 1,2,,N},对应的本地数据集: D 1 , D 2 , . . . , D N \mathcal{D}_1, \mathcal{D}_2, ..., \mathcal{D}_N D1,D2,...,DN
  • 在这个edge上的所有训练样本的损失函数: F n ( w ) ≜ 1 D n ∑ j ∈ D n f j ( w ) F_n(w) \triangleq \frac{1}{\mathcal{D}_n} \sum_{j \in \mathcal{D}_n} f_j(w) Fn(w)Dn1jDnfj(w)
  • 定义 D = ∑ n = 1 N D n D = \sum^N_{n=1} D_n D=n=1NDn
  • 分布式数据集的全局损失函数: F ( w ) ≜ ∑ j ∈ ∪ n D n f j ( w ) ∣ ∪ n D n ∣ = ∑ n = 1 N D n F n ( w ) D F(w) \triangleq \frac{\sum_{j \in \cup_n \mathcal{D}_n} f_j(w)}{|\cup_n \mathcal{D}_n|} = \frac{\sum^N_{n=1}D_n F_n(w)}{D} F(w)nDnjn
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值