Role Prompting Guided Domain Adaptation with General Capability Preserve for Large Language Models

本文是LLM系列文章,针对《Role Prompting Guided Domain Adaptation with General Capability
Preserve for Large Language Models》的翻译。

基于角色提示的大型语言模型通用能力保留域自适应

摘要

对用于专业应用程序的大型语言模型(LLM)的兴趣日益增长,这揭示了一个重大挑战:当针对特定领域进行定制时,LLM往往会经历灾难性的遗忘,损害其一般功能,并导致次优的用户体验。此外,由于域之间的混淆,同时为多个域创建通用模型往往会导致整体性能下降。针对这些问题,我们提出了RolE提示引导多领域适应(REGA)策略。这种新方法通过三个关键组成部分有效地管理多域LLM自适应:1)自蒸馏构建和重放一般域样本,以缓解灾难性遗忘。2) 角色提示为一般域分配一个中心提示,为每个特定域分配一一个唯一的角色提示,以最大限度地减少训练过程中域间的混乱。3) 角色集成重用并集成一小部分特定于领域的数据到通用领域数据,这些数据在中央提示的指导下进行训练。中央提示用于简化推理过程,消除了为不同域切换提示的必要性。实证结果表明,REGA有效地缓解了灾难性遗忘和领域间混乱。与标准微调模型相比,这提高了特定领域的性能,同时仍保留了强大的通用功能。

1 引言

2 相关工作

3 方法

4 实验

5 深入分析

6 讨论

7 结论

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值