联邦学习FL+激励机制+区块链论文阅读2

Reputation-Based Regional Federated Learning for Knowledge Trading in Blockchain-Enhanced IoV
区块链增强物联网中基于声誉的知识交易区域FL

论文资源已免费上传

现存问题

大量数据导致的冗余传输和网络拥塞以及安全和隐私问题

本文设计

1)提出区域联合学习(RFL),其中所有区域都维护自己的学习模型,即知识。

2)设计了一个信誉机制来衡量参与RFL的车辆的可靠性。

3)为了应对不受信任的集中交易市场带来的安全挑战,提出了一个区块链增强的知识交易框架,在该框架中,将最优定价机制建模为非合作博弈,

系统模型

    1概述

       分为两个模块:知识生成和知识交易

       在生成阶段,每个区域由一个路侧单元(RSU)作为领导者来聚合本地模型,直到全局模型的损失小于某个阈值。领导者会检测车辆上传的本地模型的质量并在模型聚合之前删除不可靠的恶意更新。车辆根据其训练行为获得不同的声誉。聚合的模型参数和信誉将根据时间序列进行加密和结构化,并添加到每个区域的区块链中。

       在交易阶段,区域RSU上行链路通信连接到移动边缘计算单元MEC,下行链路通信连接到其范围内的车辆。在知识交易过程中,特定区域的区域RSU充当知识请求者,并向其他区域RSU发送请求包。假设多个满足需求的RSU充当知识提供者,并响应需求。 MEC(智能合约中的授权市场代理)自动执行知识的协商和交易处理,从n个提供者中选择最佳的知识提供者,所选择的提供者将知识直接发送给请求者。交易记录在区块链中。

    2 信誉值

        区域的划分是基于移动性的聚类度量(MOBIC),即通过计算每个车辆的本地移动性值,然后基于聚类对车辆进行划分[12]。当车辆离开当前领导者,并且在其通信范围内有另一个领导者时,它将向领导者提交认证申请加入新的地区,只有其信誉值大于该区域设定的阈值才会被接受。

       讨论单个车辆及其领导者之间声誉的影响(i和j分别用于表示车辆及其领导者),基于诚实度(HD),精度贡献(Ac), 交互时效性计算车辆的信誉:

       1)诚实度(HD):车辆i与领导者j之间的交互有积极共享(PS),全局模型的准确性将得到提高,其声誉也将得到提高;负面分享(NS)与之相反。依据PS和NS, HD可以分为两类:

IA_{j\rightarrow i}即i,j之间总交互数, IA_{P}/IA_{N}即i,j之间PS/ NS的个数)

        2)精度贡献(Ac):车辆i和其领导者j之间的第t次交互之前和之后的全局模型的损失表示为 l_{t-1_{j\rightarrow i}}l_{t_{j\rightarrow i}} ,则精度贡献为

       当第t次交互作用后,全局模型的损失减少,意味着更新的模型是有用的,损失减少程度越大,精度贡献值越大。由于交互方式有积极共享(PS),负面分享(NS)两种,精度贡献分为正贡献和负贡献。

       3)交互及时性:最近的事件对的声誉计算影响更大。定义为

       其中Tc是当前时间,T_{t_{j\rightarrow i}}是车辆在第t次共享本地模型的时间,模型贡献被视为一个加权因子,该式同时考虑模型贡献和及时性的重要性。与精度贡献一样,交互及时性也可以分为正值和负值。

       4)故信誉值为

       补充;区域的信誉值阈值为 ,λ值可以根据模型训练的要求动态调整。λ值越大,对模型可靠性的要求越高,需要进行更多的迭代以使全局模型的损失满足一定的要求条件。申请加入的车辆的信誉值大于阈值,才能加入。

基于智能合约的知识交易市场

    1.交易市场工作模型

         1)请求:请求者RSU发送特定的需求包;

         2)发布:市场代理收集知识请求包并进行广播。

         3) 响应:供应者RSU在截止日期前向市场代理发送响应消息。  

         4) 选择:市场代理可能收到对某个知识请求的多个响应,进行选择。  

         5) 决定:知识请求者将其预算与给出的价格进行比较,并决定交易是否发生。  

         6) 交易。

    2.对知识提供者之间的竞争进行建模,即最优定价机制

          分别表示个人账户、数据集的规模,参数以及知识定价

        知识价值:知识价值函数估计原始数据和知识之间的差距,定义为

                

               η,γ是用于控制知识价值增加程度的经济参数。

        传输质量 :  

                                          

         知识提供者j的成本=知识获取成本+通信延迟

                                               

         每个区域 其中 d_{mj}表示提供者j和获取者m之间的距离,v是信道中电磁波传播的速度。

         提供者j的竞争优先级

         知识提供者j的竞争力

         知识提供者j的效用是竞争力和利润的乘积:

p_{-j} 是除j以外的其他提供者的价格概况)

        效用优化问题,供应商通过设置定价策略来相互竞争,这被建模为非合作博弈 

          其中

          即每个提供者j提供价格pj以最大化效用。

          该最优定价机制被放置在智能合约中,并在任何请求者从系统发出请求后自动执行。市场代理选择具有最大效用的满足请求的提供者。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值