东北大学：LLM模型合并技术综述_model merging in llms, mllms, and beyond: methods,-CSDN博客

本文链接：https://blog.csdn.net/weixin_46739757/article/details/141933520

在这里插入图片描述

📖标题：Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities
🌐来源：arXiv, 2408.07666

摘要

🔸模型合并是机器学习社区中一种高效的增强技术，不需要收集原始训练数据，也不需要昂贵的计算。随着模型合并在各个领域中越来越普及，全面了解可用的模型合并技术变得至关重要。然而，目前文献中存在一个重要的差距，即缺乏对这些技术进行系统和全面审查的论述。
🔸本文综述了模型合并方法和理论的全面概述，以及它们在各种领域和环境中的应用和未来研究方向。具体而言，我们首先提出了一种新的分类方法，详尽地讨论了现有的模型合并方法。其次，我们讨论了模型合并技术在大型语言模型、多模态大型语言模型以及包括持续学习、多任务学习、少样本学习等在内的10多个机器学习子领域中的应用。最后，我们强调了模型合并面临的剩余挑战，并讨论了未来的研究方向。
🔸关于模型合并的全面论文列表可在 https://github.com/EnnengYang/Awesome-Model-Merging-Methods-Theories-Applications上找到。