【论文阅读】FedBABU：TOWARD ENHANCED REPRESENTATION FOR FEDERATED IMAGE CLASSIFICATION

最新推荐文章于 2024-09-27 15:56:17 发布

噜噜噜鹿鹿

最新推荐文章于 2024-09-27 15:56:17 发布

阅读量279

点赞数 3

分类专栏：联邦学习文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52330760/article/details/142527864

版权

联邦学习专栏收录该内容

6 篇文章 1 订阅

订阅专栏

算法流程：

训练过程中冻结客户端的头部参数，只训练主体参数。训练完之后再在客户端本地跑几个epoch微调一下（文章推荐5个）。
由于该算法与FedPer思路过于相似，故读完后跑了个实验。
FedPer:训练过程中只聚合主体参数。与BABU不同的是，BABU直接把头部参数给冻结了，而Per头部依旧是参与训练的。实验结果如下：
在这里插入图片描述

引出的疑惑是，Per的头部是全程参与训练的，而BABU的头部训练时是冻结的，只是最后tune了几个epochs，然而Per的性能竟然弱这么多，这是为什么？
最后看到文章第四节实验部分有提到，若过度关注于模型的初始性能（没有本地finetune过的性能），则会导致个性化准确率的减少。同时，集中训练的模型更难个性化。Per的头部参与了过多的训练，这可能是其个性化性能较差的原因。当然本人还有另一种想法，就是Per同时训练头部和主体参数，头部因训练而造成参数的改变也会影响主体的训练效果。而BABU完全锁定了头部参数，专注于主体参数的训练，就是在训练时专注于特征提取能力的提升，这样会使得BABU的主体层性能高于Per，而个性化性能只需要finetune几下就能训练好了，差别不大，故最终BABU的性能高于Per。
另外暂不清楚为何BABU性能弱于avg+finetune但论文中显示BABU明显优于avg+finetune

在这里插入图片描述

噜噜噜鹿鹿

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。