带个性化层联邦学习论文解读

先上结论:本文提出了一种新颖的方法Fed Per,使用现有的联邦学习方法,将深度学习模型视为基础+个性化层,以协作方式对基础层进行训练,在本地进行个性化层训练,用于捕获联邦学习设置中用户的个性化方面。
结果表明,具有基础+个性化层的模型有助于对抗统计异质性的不利影响。在FLICKR - AES和CIFAR数据集上的实验结果表明了FedAvg的无效性和FedPer在建模个性化任务方面的有效性。

背景:

一个单词:statistical heterogeneity 统计学异质性

不同设备数据可能是异构的,本文提出了一种用于深度前馈神经网络联邦训练的基层+个性化层方法Fed Per,可以对抗统计异构性带来的不良影响。

图为提出的个性化联合方法示意图,主要的思想为基本层+个性化层

  1. 所有的客户设备共享基本层(蓝色),共享相同的权重,这些权重来自参数服务器,所以基本层和服务器也是共享的
  2. 由于数据分布的不同,不同客户设备具有不同的个性化顶层,可以潜在地适应单个数据。

我们研究了个性化设置作为统计异质性来源对深度前馈神经网络联邦学习的影响。

个性化是机器学习的一个关键应用,并且可能实现,因为从原始用户数据中捕获的用户偏好不同。

在边缘设备属于用户的联合设置中,这必然意味着用于个性化的数据在统计上是异构的。

而将联邦平均扩展到深度神经网络模型或协同过滤无法解决的问题的效果并不明显。个性化联邦学习的正确方法是一个非常重要的问题,研究界对此几乎没有触及。

挑战:
特征提取,相同数据不同标签,这超过了联邦学习学习一个全局模型,并在每个客户端上有效地在本地复制的模式范围。数据多,用户设备多,差异大,难以克服统计学异质性的不利影响。用户数据少时,它们共享需要数据重叠,而像个性化图像美学和个性化高光检测,使用数据集重叠是没有用的

本文贡献:

(1)将深度学习模型视为基本+个性化层来捕获联邦学习中的个性化方面
(2)我们的训练算法包括由联邦平均(或其某些变体)训练的基础层和仅从具有随机梯度下降(或其某些变体)的本地数据训练的个性化层
(3)免于联邦平均( FedAvg )过程的个性化层可以帮助对抗统计异质性的不利影响

模型和算法设置:

模型:根据个性化方法联合示意图,所有用户设备共享相同的基础层,并具有独特的个性化层,构成深度前馈神经网络模型。

模型假设:

(1)假设权重张量WPj在第j个设备上捕获个性化的所有方面。

(2)任何客户端的数据集在全局聚合中都不会发生变化

(3)批大小b和迭代次数e在客户端和全局聚合之间是不变的

(4)每个客户端使用SGD在全局聚合之间更新

(5)在整个训练过程中,所有N个用户设备都处于活动状态。

参数和公式:

意义

符号

每个客户设备上的基本层数目

K_{B}

每个客户设备上的个性化层数目

K_{P}

用户设备总数

N

基本层权重矩阵

W_{B,1},W_{B,2},...,W_{B,K_{B}};由于基本权重矩阵可能拥有不同的维度,为了简单表示,便合成一个元组

(W_{B,K_{B}},...,W_{B,2},W_{B,1}),简称W_{B}

基本层权重矩阵对应的向量值激活函数

a_{B,1},a_{B,2}...a_{B,K}

第j个用户设备的个性化层权重矩阵,j ∈ {1, 2, . . . , N }

W_{P_{j},1},W_{P_{j},2},...,W_{P_{j},K_{P}};和基本权重矩阵一样,倒序简化为元组,简称为W_{P_{j}}

个性化层权重矩阵对应的向量值激活函数

a_{P_{j},1},a_{P_{j},2},...,a_{P_{j},K_{P}}

在第j个设备上进行的前向传递操作,即神经网络的forward pass。原始公式看上去十分复杂,可以不用管,只关心输入和输出即可,即客户端的样本首先经过基本层,然后再经过个性化层,最后得到输出

在这里插入图片描述

可简化为\hat{y}=f(x;W_{b},W_{P_{j}})

需要优化的损失函数(即所有客户端损失的均值)

其中L( · , ·)表示所有设备共有的每个样本损失函数

学习的目标是通过权重张量W_{B},W_{P_{1},...,W_{P_{N}}}最小化average personalized population risk function【这翻译起来十分不和语境,我也不知道怎么翻了】

在这里插入图片描述

所有设备通用的每个样本损失函数

(即其中第j个设备上的损失)

在这里插入图片描述

数据集的批次大小

b

数据集的迭代次数

e或k

学习率

\eta

算法设计:

本算法依赖于随机梯度下降( SGD )作为子程序。
最小化经验风险函数(average personalized population risk function )的标准公式要求指定以下内容:
(a).将由SGD更新的决策变量及其初始值
(b).划分数据集的批次大小,数据集的迭代次数
(c).学习率

第j个客户端的步骤

1:客户端初始化自己的个性化层权重W_{P_{j}}^{(0)},而且这一步好像还是无规律的,随机的

2:这里我怀疑论文作者写错了,文中并没有n_{j}这个符号,应该是第j个客户端送走自己的学习率\eta _{j},服务器端接收各设备的\eta _{j},然后以新的公式聚合,这是符合不同设备个性化的 【后来发现没有写错,n_{j}是第j个设备上可用的训练样本数,但我认为自己的学习率也是一个很好的参数,可以各个设备不同和中央聚合】

3:文中写道用上标k表示迭代轮数,所以这里是迭代次数的意思

4:这里W_{B}^{(k-1)}是服务器端聚合后的权重,将用于本地个性化训练

5:为了既实现个性化又联合联邦学习的优势,使用了全局聚合的参数,也使用了设备本地个性化的权重矩阵,并本设备的学习率\eta _{j}^{(k)}执行SGD,显然,括号里的三个参数,除了第一个基本层全局权重,在不同设备几乎都是不一样的,SDG更新后的值简单的以(W_{B,j}^{(k)},W_{P_{j}}^{(k)})表示。

6:并且只传输W_{B,j}^{(k)}到服务器,这是为了保护隐私

7:在两个服务器之间往复,直到迭代完毕

FedPer的服务器组件的步骤

1:基本层的权重矩阵初始化

2:接受各设备传来的可用样本数n_{j},计算方法有点类似加权,得出一个新的参数\gamma _{j},后面聚合权重要用到 

3:为各设备奉上基本层权重数据

4:在每轮迭代中:

5:接受被各设备(或第j个)更新过的基本层权重矩阵W_{B,j}^{(k)}

6:使用W_{B,j}^{(k)}\gamma _{j}作为参数聚合,得到新的基本层权重数据W_{B}^{(k)}

7:共享基本层权重数据W_{B}^{(k)}到客户设备端 

8:结束

FedPer的服务器组件的步骤在算法2中详述,第j个客户端的步骤在算法1中描述。服务器使用基于FedAvg的方法在全局上训练基础层,而每个客户端使用SGD风格算法在本地更新其基础层和个性化层(在连续的全局聚集之间)。

### 大数据专业毕业设计方向及合法合规的数据源 #### 一、大数据专业毕业设计方向 对于大数据专业的学生来说,即使不使用爬虫获取数据,仍然有许多其他有价值的课题可以选择。以下是几个可能的研究方向: 1. **基于公开API的数据分析** 利用各大公司提供的官方开放接口来收集所需的信息并进行深入挖掘。例如社交媒体平台Twitter API可以用于情感分析;Google Maps API可用于地理空间数据分析。 2. **医疗健康领域的大数据分析** 结合医院信息系统中的电子病历(EMR)、医学影像资料等结构化和非结构化的海量医疗记录开展疾病预测模型构建等工作[^1]。 3. **物联网(IoT)设备产生的传感器数据处理** 物联网环境中各类智能终端每天都会产生大量实时监测数值,如温度湿度计读数、车辆行驶轨迹坐标等等。这些原始观测值非常适合用来训练机器学习算法实现异常检测等功能。 4. **政府统计数据的应用开发** 许多政府部门会定期发布国民经济运行状况报告以及人口普查成果等内容详实的统计年鉴文件。利用这类权威发布的宏观面指标能够支持宏观经济形势研判类项目的实施。 5. **教育评估与个性化推荐系统建设** 高校教务处保存着丰富的学籍管理档案,包括但不限于成绩册、选课意向调查问卷等个人信息资源。通过建立精准的学生画像进而优化教学资源配置具有重要的现实意义。 6. **金融风险预警机制探索** 借助银行内部交易流水账单、信用评分卡反馈结果等私密性较高的业务文档作为输入特征向量参与建模过程,有助于提高金融机构防范化解潜在危机的能力水平。 7. **环境科学范畴内的遥感图像解析** 卫星拍摄所得地球表面照片蕴含着关于植被覆盖度变化趋势、水域面积扩张收缩规律等方面的重要线索等待被发现解读出来服务于生态保护事业。 8. **交通流量模式识别** 出租车GPS定位信号回传数据库内存储有详细的行车路线规划建议供城市规划师参考借鉴以便更好地解决拥堵难题改善居民出行体验质量。 9. **能源消耗监控与节能增效措施制定** 工业园区电力供应设施运营维护部门掌握着各生产车间耗电量的历史沿革情况图表可供研究人员从中探寻降低单位产品能耗的有效途径。 以上列举了一些无需依赖网络抓取技术即可完成高质量学术论文撰写的思路框架仅供参考选用。 #### 二、合法合规的数据集来源渠道 为了确保所使用的数据集完全符合法律法规的要求,在项目启动前应当优先考虑以下几个方面的优质素材库: - **Kaggle竞赛平台**:由谷歌旗下子公司主办的比赛活动经常提供丰富多样且标注清晰的标准测试样本集合给参赛者练习使用。 - **UCI Machine Learning Repository**:隶属于加州大学欧文分校信息学院下属机构负责管理和分发的一系列经典案例集涵盖了多个学科门类下的实际应用场景实例。 - **AWS Public Datasets Program**:亚马逊云服务提供商免费对外开放访问权限的一些大型公共性质的数据仓库比如基因组序列片段、气象预报参数等。 - **Microsoft Research Open Data**:微软研究院致力于推动科研进步而设立的一项计划旨在促进跨地区交流合作共享研究成果其中包括了许多有趣的话题探讨机会。 - **Data.gov**:美国联邦政府官方网站上集中展示了众多国家级别的行政管理部门日常工作中积累下来的宝贵财富涉及范围广泛几乎囊括了社会生活的方方面面。 - **Figshare**:一个面向全球学者开放投稿发表原创作品的小型在线社区允许用户上传个人创作的同时也鼓励大家积极下载他人分享出来的精品力作相互交流共同成长。 - **Harvard Dataverse Network**:哈佛大学图书馆牵头组建而成的世界范围内颇具影响力的分布式数字仓储联盟成员之间互相协作共建了一个庞大的文献索引体系方便检索查询特定主题的相关材料。 综上所述,即便是在严格遵循现行法律制度的前提下依然存在着无数种可能性等着各位同学去发掘尝试从而顺利完成学业任务目标。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值