LLM 模型融合实操技术

最新推荐文章于 2024-08-07 17:42:24 发布

m0_70960708

最新推荐文章于 2024-08-07 17:42:24 发布

阅读量62

点赞数

分类专栏：笔记文章标签： python 机器学习算法

本文链接：https://blog.csdn.net/m0_70960708/article/details/140916571

版权

笔记专栏收录该内容

125 篇文章 0 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

01 🤝 融合算法
在本节，我们将重点介绍 mergekit 库目前实现的四种模型融合方法。请注意，还有其他方法，比如 linear [8]和 Task Arithmetic [9]。如果你对模型融合的相关论文感兴趣，我推荐阅读Hugging Face上的这本优秀论文集[10]。

1.1 SLERP
Spherical Linear Interpolation（SLERP）是一种用于在两个向量之间进行平稳和连贯地插值的方法。这种方法能够保持恒定的变化速率，并保留向量所在球面空间的几何特性。

与使用传统的线性插值方法相比，SLERP 更受青睐的原因有几个。例如，在高维空间中，线性插值（linear interpolation）可能导致插值向量的大小（幅度）减小（即权重的规模减小）。此外，权重方向的变化往往比大小（幅度）的变化代表的信息更有意义（如特征学习（Feature Learning）和表征（Representation））。

SLERP 是通过以下步骤实现的：

对输入的向量进行归一化处理，使它们的长度（magnitude）变为单位长度（长度为1）。这一步骤的目的是确保这些向量表示的是方向，而不是大小。
使用点积计算这些向量之间的角度。
如果这些向量几乎平行，则默认使用线性插值以提高效率。如果输入的两个向量夹角较大，SLERP 将根据插值因子 t （插值因子 t 是一个介于 0 到 1 之间的值，用于指定插值的程度。t=0 表示完全使用第一个向量，t=1 表示完全使用第二个向量，而在 0 到 1

了解本专栏

超级会员免费看

m0_70960708

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LLM 模型融合实操技术

可以肯定的是，Marcoro14-7B-slerp 受到了污染，而且这次融合中使用的一些模型应该是在这些评估测试集上训练过的。具体做法是在模型微调（fine-tuning）的过程中，关注模型参数发生的变化，对微调过程中发生的变化进行排序，并选择那些对模型性能影响最显著的前 k% 的变化，并忽略那些在微调中变化较小或对性能影响较小的部分。这次，我们将使用两个不同的模型： Marcoroni-7B-v3[23] 和 Mistral-7B-Merge-14-v0.1[24] 并用 SLERP 方法进行模型融合。
复制链接

扫一扫