X-LORA: MIXTURE OF LOW-RANK ADAPTER EXPERTS, A FLEXIBLE FRAMEWORK for LLMs

515 篇文章 3 订阅

已下架不支持订阅

37 篇文章 1 订阅
4 篇文章 1 订阅
本文介绍了X-LoRA,一种使用低秩自适应(LoRA)专家的混合策略,以微调大型语言模型。这种方法基于生物学原理,通过门控策略动态混合自适应层,允许模型在不同任务中利用不同能力,适用于蛋白质力学和设计等科学任务。X-LoRA展示了在不改变底层结构的情况下,如何在现有LLM中扩展和融合专业知识。
摘要由CSDN通过智能技术生成

本文是LLM系列文章,针对《X-LORA: MIXTURE OF LOW-RANK ADAPTER EXPERTS, A FLEXIBLE FRAMEWORK FOR LARGE LANGUAGE MODELS WITH APPLICATIONS IN PROTEIN MECHANICS AND DESIGN》的翻译。

X-LORA:低级别适配器专家的混合体,一个灵活的大型语言模型框架,在蛋白质力学和设计中的应用

摘要

我们报告了一种混合专家策略,使用基于低秩自适应(LoRA)的深层token级方法创建微调的大型语言模型。从一组预训练的LoRA适配器开始,我们提出了一种门控策略,该策略使用隐藏状态来动态混合自适应层,允许生成的X-LoRA模型利用不同的能力,并创建以前从未使用过的自适应深层组合,以解决特定任务。该设计的灵感来自普遍性和多样性的生物学原理,其中神经网络构建块在不同的层次表现中被重复使用。因此,X-LoRA模型可以很容易地用于任何现有的大型语言模型(LLM),而不需要修改底层结构。我们开发了一个量身定制的X-LoRA模型,该模型提供科学能力,包括正向/反向分析任务和增强的推理能力,专注于生物材料分析、蛋白质力学和设计。这项工作的影响包括访问易于扩展、适应性强和可更改的模型,这些模型具有强大的领域知识和跨知识领域集成的能力。X-LoRA模型由生物学、数学、推理、生物启发材料、力学和材料、化学和蛋白质力学等领域的专家组成,我们进行了一系列以物理学为重点的案例研究。我们研究了知识召回、蛋白质力学

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值