探索语言模型新境界：CALM

本文链接：https://blog.csdn.net/gitblog_00016/article/details/139695848

探索语言模型新境界：CALM - Pytorch

CALM Logo

CALM 是一个由 Google DeepMind 开发的最新开源项目，它的全称为 "Composition of Augmentation Language Models"。这个项目实现了论文《LLM Augmented LLMs: Expanding Capabilities through Composition》中提出的技术，通过组合多个增强型语言模型（augmentation LLMs），以提升大模型的性能和能力。

项目介绍

CALM-Pytorch 是对原始研究的 PyTorch 实现，它允许开发者轻松地将任意数量的增强 LLMs 连接到基础模型（anchor LLM）上，从而构建出更强大的复合模型。这个库不仅提供了模型结构的实现，还提供了一个简洁易用的接口，用于训练和推理。

项目技术分析

CALM 的核心是一个名为 CALM 的类，它接受一个基础模型和一个或多个增强模型作为参数，并能够指定它们之间的连接方式。内部处理包括如何在不同模型之间共享注意力权重，以及在训练和推断过程中如何管理这些权重的状态。此外，项目还包括了一个便捷的 FineTuner 类，它利用 🤗 Accelerate 库进行高效的并行训练。

值得一提的是，CALM 允许用户自定义连接模式，可以在基础模型的不同层与增强模型的特定层间建立联系，从而实现更灵活的模型融合。