X-LORA: MIXTURE OF LOW-RANK ADAPTER EXPERTS, A FLEXIBLE FRAMEWORK for LLMs

最新推荐文章于 2024-09-10 13:47:50 发布

UnknownBody

最新推荐文章于 2024-09-10 13:47:50 发布

阅读量89

点赞数

分类专栏： MoE LLM for Medical 文章标签：人工智能算法

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/136845574

版权

LLM 日更同时被 3 个专栏收录

515 篇文章 3 订阅

已下架不支持订阅

LLM for Medical

37 篇文章 1 订阅

订阅专栏

MoE

4 篇文章 1 订阅

订阅专栏

本文介绍了X-LoRA，一种使用低秩自适应（LoRA）专家的混合策略，以微调大型语言模型。这种方法基于生物学原理，通过门控策略动态混合自适应层，允许模型在不同任务中利用不同能力，适用于蛋白质力学和设计等科学任务。X-LoRA展示了在不改变底层结构的情况下，如何在现有LLM中扩展和融合专业知识。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《X-LORA: MIXTURE OF LOW-RANK ADAPTER EXPERTS, A FLEXIBLE FRAMEWORK FOR LARGE LANGUAGE MODELS WITH APPLICATIONS IN PROTEIN MECHANICS AND DESIGN》的翻译。

X-LORA：低级别适配器专家的混合体，一个灵活的大型语言模型框架，在蛋白质力学和设计中的应用

摘要
1 引言
2 结果与讨论
3 结论

摘要

我们报告了一种混合专家策略，使用基于低秩自适应（LoRA）的深层token级方法创建微调的大型语言模型。从一组预训练的LoRA适配器开始，我们提出了一种门控策略，该策略使用隐藏状态来动态混合自适应层，允许生成的X-LoRA模型利用不同的能力，并创建以前从未使用过的自适应深层组合，以解决特定任务。该设计的灵感来自普遍性和多样性的生物学原理，其中神经网络构建块在不同的层次表现中被重复使用。因此，X-LoRA模型可以很容易地用于任何现有的大型语言模型（LLM），而不需要修改底层结构。我们开发了一个量身定制的X-LoRA模型，该模型提供科学能力，包括正向/反向分析任务和增强的推理能力，专注于生物材料分析、蛋白质力学和设计。这项工作的影响包括访问易于扩展、适应性强和可更改的模型，这些模型具有强大的领域知识和跨知识领域集成的能力。X-LoRA模型由生物学、数学、推理、生物启发材料、力学和材料、化学和蛋白质力学等领域的专家组成，我们进行了一系列以物理学为重点的案例研究。我们研究了知识召回、蛋白质力学

了解本专栏

UnknownBody

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
X-LORA: MIXTURE OF LOW-RANK ADAPTER EXPERTS, A FLEXIBLE FRAMEWORK for LLMs

我们报告了一种混合专家策略，使用基于低秩自适应（LoRA）的深层token级方法创建微调的大型语言模型。从一组预训练的LoRA适配器开始，我们提出了一种门控策略，该策略使用隐藏状态来动态混合自适应层，允许生成的X-LoRA模型利用不同的能力，并创建以前从未使用过的自适应深层组合，以解决特定任务。该设计的灵感来自普遍性和多样性的生物学原理，其中神经网络构建块在不同的层次表现中被重复使用。因此，X-LoRA模型可以很容易地用于任何现有的大型语言模型（LLM），而不需要修改底层结构。
复制链接

扫一扫