超越微调模型

RA AI衍生者训练营

已于 2024-09-01 15:48:18 修改

阅读量1k

点赞数 25

文章标签：人工智能 ai 开发语言机器学习语言模型

于 2024-09-01 15:47:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/RamendeusStudio/article/details/141785320

版权

介绍：

计算机视觉和自然语言处理领域正在迅速发展，对针对特定下游任务进行微调的专用模型的需求日益增长。然而，拥有不同的微调模型有多个缺点：
1. 对于每个任务，必须存储和部署单独的模型（可以通过应用 LoRA 等方法进行微调来解决此问题）。2
. 独立微调的模型无法从相关任务的信息中获益，这限制了它们在域内和域外任务中的泛化。然而，多任务学习需要访问每个特定任务的数据集，而整合这些数据集可能很复杂。如果我们无法访问所有下游任务的数据集，但可以使用微调模型，该怎么办？想象一下，您需要一个针对一组特定任务进行微调的大型语言模型 (LLM)。您无需为下游任务收集大量数据集并进行资源密集型的微调过程，而是可以找到针对每个任务进行微调的 LLM，并合并这些模型以创建所需的模型。请注意，在拥有约 50 万个经过微调的模型的大型 Hugging Face 存储库中找到此类模型并不困难。合并多个模型最近引起了广泛关注，主要是因为它需要轻量级计算并且不需要训练数据。

图 1 模型集成将多个模型的输出组合在一起以提高准确性，但需要更多的计算资源。多任务学习同时在多个任务上训练一个模型，需要访问所有数据集和高计算能力。然而，模型合并将预先训练的模型融合为一个，以最少的计算和不增加额外训练成本的方式利用它们的优势，提供了一种高效的解决方案（图片来自论文）。

随着人们对合并的关注度不断提高，WEBUI 和 MergeKit 等公共库已经开发出来以促进这一过程。WebUI 可以使用不同的合并技术合并经过微调的模型（例如稳定扩散）。MergeKit 是一个开源的集中式库，提供不同的合并方法。它通过高效实现适用于任何硬件的合并技术来促进模型合并。

在这里，我们将合并方法分为三大类：1. 合并具有相同架构和初始化的模型；2. 合并具有相同架构但初始化不同的模型；3. 合并具有不同架构的模型。每个类别都涉及不同的技术来有效地组合模型，下面将对此进行解释。

1. 合并具有相同架构和初始化的模型：

1.a 无需数据合并：

本节中的模型合并方法均基于线性模式连接（LMC）。LMC 建议，对于具有相同架构和初始化的模型，其检查点之间的损失可以通过低损失的线性路径连接。这意味着可以使用线性插值组合这些模型。

为了微调模型，可以应用各种配置，例如不同的学习率、随机种子和数据增强技术，从而产生不同的模型参数。模型汤

最低0.47元/天解锁文章

RA AI衍生者训练营

关注

25
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

RA AI衍生者训练营

CSDN认证博客专家 CSDN认证企业博客

码龄2年

150: 原创

105万+: 周排名

1万+: 总排名

12万+: 访问

: 等级

3957: 积分

1911: 粉丝

2446: 获赞

9: 评论

1818: 收藏

私信

关注

热门文章

分类专栏

AI 2篇
国画 1篇
少女 3篇
玫瑰的故事 2篇
服饰 2篇
墨雨云间 1篇
DB 1篇

最新评论

“生活不是等待风暴过去，而是学会在雨中跳舞。“
Kwan的解忧杂货铺@新空间代码工作室: 感谢博主的分享🎉🎉🎉，每一篇文章都是一份珍贵的学习资料。博主的文章写得非常详细🔥🔥🔥，让我不仅学到了知识，还培养了对这个领域的浓厚兴趣🍭🍭🍭。期待未来更多的独到见解和教程！希望博主能继续分享这样有深度的文章！
FLUX.1 最强AI绘画开源模型，最新本地部署教程
深圳王哥: FLUX.1听起来真的很先进，Black Forest Labs团队背景强，经验丰富。三种模式满足不同需求，Flux Pro图像质量惊艳，Flux Dev适合开发者探索，Flux Schnell对个人项目友好。性能和速度都超预期，期待更多人用它创作出精彩作品。
永结无间Ⅱ--大语言模型最终会代替人类吗？
RA AI衍生者训练营: 没有特别的意思。。。
永结无间Ⅱ--大语言模型最终会代替人类吗？
qq_43627494: 永结无间是啥意思
绝区肆--2024 年AI安全状况
ha_lydms: 牛牛牛！太全面了，以后要用，忘记了直接来这里找表情包

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。