《Robust fine-tuning of zero-shot models》提出的Wise-ft，真能解决大模型持续学习的灾难性遗忘吗？

最新推荐文章于 2024-09-16 20:12:46 发布

Bob 的AI视界

最新推荐文章于 2024-09-16 20:12:46 发布

阅读量921

点赞数 9

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73185787/article/details/141160248

版权

❝
大家好，我是 Bob! 😊

一个想和大家慢慢变富的 AI 程序员💸

分享 AI 前沿技术、项目经验、面试技巧!

欢迎关注我，一起探索，一起破圈！💪

微调框架：

https://github.com/mlfoundations/wise-ft

论文链接

https://arxiv.org/pdf/2109.01903

背景信息：

现有的方法在微调零样本模型时存在两个关键问题。

首先，微调模型的鲁棒性在数据分布发生变化时会有很大差异，这种差异受微调过程中的超参数影响显著，但仅通过目标分布上的准确性无法推断出最佳的超参数。
其次，更激进的微调（如使用更大的学习率）虽然在目标分布上能带来更大的准确性提升，但在数据分布变化时可能会导致准确性大幅下降。

WiSE-FT

论文提出了WiSE-FT（Weight-space Ensembling for Fine-tuning）的微调方法。

● 这个方法的好处：WiSE-FT（Weight-space Ensembling for Fine-tuning）方法通过组合零样本模型的权重和微调后模型的权重来解决上述问题。这种方法简单、通用，能够在不增加额外计算成本的情况下，通过几行代码实现。

image

WiSE-FT在多个数据集上展示了比标准微调更好的准确性，尤其是在数据分布变化时，提高了模型的鲁棒性。

算法原理与实现：

WiSE-FT具体实现包括以下步骤：

● 微调零样本模型：首先，需要在特定应用数据上微调预训练的零样本模型。这可以通过标准的微调过程来完成，即在新的数据集上训练模型的参数，以适应新的任务。

● 权重组合：微调完成后，将微调后的模型权重与原始零样本模型的权重进行组合。这种组合是通过线性插值实现的，即对两个模型的权重进行加权平均。加权平均的权重α是一个超参数，可以根据具体情况进行调整。

● 权重空间组合：在微调过程中或微调结束后，通过线性插值将两个模型的权重组合起来

WiSE-FT方法的关键在于通过权重空间的组合来利用零样本模型和微调后模型的互补性。这种方法基于两个观察：

首先，零样本模型和微调后模型在权重空间中可以通过一条线性路径连接，在这条路径上模型的准确性保持较高；

其次，这种组合可以利用两个模型的互补预测能力。

实验结果

通过实验，作者发现WiSE-FT在多种数据分布变化下都能提高模型的鲁棒性，并且在多个数据集上比标准微调方法有更好的准确性。此外，WiSE-FT还在低数据量的情况下显示出性能提升，这表明即使在微调数据稀缺的情况下，该方法也能提供改进。

实验证明 WiSE-FT 提高了 Radford 等人研究的五个 ImageNet 分布偏移上微调 CLIP 模型的准确性。 [82]，同时保持或提高 ImageNet 的准确性。

具体而言，相对于微调解决方案，WiSE-FT (α= 0.5) 将分布偏移下的性能提高了 3.5、6.2、1.7、2.1、9.0 和 23.2 pp，同时将参考分布的性能降低最多 0.3 pp（准确度参考分布通常会得到改善）。

image

image

即使超参数发生微小变化，微调模型的稳健性也会发生很大变化。应用 WiSE-FT 可以解决这种脆弱性，并且可以消除参考分布和移位分布的准确性之间的权衡。

总的来说，WiSE-FT提供了一种简单有效的微调策略，可以在不增加额外计算成本的情况下提高模型的性能和鲁棒性。

Bob 的AI视界

关注

9
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Bob 的AI视界 CSDN认证博客专家 CSDN认证企业博客

码龄2年

24: 原创

77万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

468: 积分

158: 粉丝

188: 获赞

6: 评论

197: 收藏

私信

关注

热门文章

分类专栏

最新评论

《重构---年轻人的精进指南》读书篇之“大公司好还是小公司好？”
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
程序猿的恐慌时刻？智能代码编辑器Cursor
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
部署微调ChatGLM遇到的问题及解决方案
nmgxxt: 非常棒的文章，解决了我部署的问题，尤其第三个每次收入问题后显示一下就卡死，重装gradio==3.40解决，有问题的是3.50.2，第二个问题公网访问还是没解决，我是在windows下部署的，没找到赋权，把文件夹权限给完还是提示该问题
ChatGLM-6B的部署
CSDN-Ada助手: 恭喜你写了第6篇博客！标题“ChatGLM-6B的部署”让我非常好奇。我很高兴看到你持续创作，并分享有关ChatGLM-6B的部署的内容。下一步，我建议你可以继续探索ChatGLM-6B在实际应用中的效果，并分享你在部署过程中的经验和教训。期待你的下一篇博客！
ChatGLM-6B的微调
CSDN-Ada助手: 恭喜你写了第7篇博客！看到你对ChatGLM-6B的微调进行了深入的探索，我不禁为你的持续创作精神所折服。在标题中提到的微调，我想了解更多关于你应用ChatGLM-6B的目的以及微调的具体过程和结果。或许在下一篇博客中，你可以分享一些微调的心得体会和应用案例，这样读者们也能更好地理解和借鉴你的经验。期待你的下一步创作，继续保持谦虚的态度，让我们共同进步！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。