INFOCOM2020论文:An Incentive Mechanism Design for Efficient Edge Learning by Deep Reinforcement Learning Approach
系统模型
define:
- 训练样本 j j j中包含:vector x j x_j xj is the input of ML model; scalar y j y_j yj is the output of ML model.
- 对于每个训练样本 j j j有定义在参数向量ω上的损失函数
- 所有的训练数据对表示为: { x j , y j } j ∈ D n \{x_j, y_j\}_{j \in \mathcal{D}_n} { xj,yj}j∈Dn
损失函数表示表示训练数据与模型的误差。模型学习的过程是在训练样本上最小化损失函数。
- 训练样本 j j j的损失函数 f j ( w ) f_j(w) fj(w)
- ENs标识为 N = { 1 , 2 , ⋯ , N } \mathcal{N}=\{1,2, \cdots, N\} N={ 1,2,⋯,N},对应的本地数据集: D 1 , D 2 , . . . , D N \mathcal{D}_1, \mathcal{D}_2, ..., \mathcal{D}_N D1,D2,...,DN
- 在这个edge上的所有训练样本的损失函数: F n ( w ) ≜ 1 D n ∑ j ∈ D n f j ( w ) F_n(w) \triangleq \frac{1}{\mathcal{D}_n} \sum_{j \in \mathcal{D}_n} f_j(w) Fn(w)≜Dn1∑j∈Dnfj(w)
- 定义 D = ∑ n = 1 N D n D = \sum^N_{n=1} D_n D=∑n=1NDn
- 分布式数据集的全局损失函数: F ( w ) ≜ ∑ j ∈ ∪ n D n f j ( w ) ∣ ∪ n D n ∣ = ∑ n = 1 N D n F n ( w ) D F(w) \triangleq \frac{\sum_{j \in \cup_n \mathcal{D}_n} f_j(w)}{|\cup_n \mathcal{D}_n|} = \frac{\sum^N_{n=1}D_n F_n(w)}{D} F(w)≜∣∪nDn∣∑j∈∪n