论文阅读-DRL求解Edge Learning中的激励机制

最新推荐文章于 2022-07-14 11:13:29 发布

HezeLao

最新推荐文章于 2022-07-14 11:13:29 发布

阅读量576

点赞数 1

分类专栏：激励机制强化学习文章标签：机器学习

本文链接：https://blog.csdn.net/lao1234511111/article/details/109703748

版权

这篇INFOCOM2020论文探讨了使用深度强化学习（DRL）方法设计有效的边缘学习激励机制。通过定义损失函数和分布式数据集的全局损失，研究了如何最大化学习效果。论文考虑了边缘节点（ENs）的CPU周期数、本地训练时间、通讯模型以及资源更新的动态过程，同时引入了效用函数来衡量ENs的收益和成本。

摘要由CSDN通过智能技术生成

INFOCOM2020论文：An Incentive Mechanism Design for Efficient Edge Learning by Deep Reinforcement Learning Approach

define:

训练样本 $j$ 中包含：vector $x_j$ is the input of ML model; scalar $y_j$ is the output of ML model.
对于每个训练样本 $j$ 有定义在参数向量ω上的损失函数
所有的训练数据对表示为： $\{x_j, y_j\}_{j \in \mathcal{D}_n}$

损失函数表示表示训练数据与模型的误差。模型学习的过程是在训练样本上最小化损失函数。

训练样本 $j$ 的损失函数 $f_j(w)$
ENs标识为 $\mathcal{N}=\{1,2, \cdots, N\}$ ，对应的本地数据集： $\mathcal{D}_1, \mathcal{D}_2, ..., \mathcal{D}_N$
在这个edge上的所有训练样本的损失函数： $F_n(w) \triangleq \frac{1}{\mathcal{D}_n} \sum_{j \in \mathcal{D}_n} f_j(w)$
定义 $\sum^N_{n=1} D_n$
分布式数据集的全局损失函数： $\triangleq \frac{\sum_{j \in \cup_n \mathcal{D}_n} f_j(w)}{|\cup_n \mathcal{D}_n|} = \frac{\sum^N_{n=1}D_n F_n(w)}{D}$

关注

专栏目录