大模型微调技术——概述

在这里插入图片描述
大语言模型推动新一波AI的火热发展,呈现百发齐放的趋势。“预训练+微调”技术,可以让百亿级语言模型短时间内解决不同下游任务的需求(金融、医疗、法律),极大提升了企业开发效率,甚至极有可能短时间内颠覆一家企业。本文对“微调技术”进行整体概述,首先汇总技术发展的背景和主流的脉络,正确看待大模型潜力和微调技术。其次是对微调技术的三大认识:三部曲(学习路线)、LLM训练、AI应用开发新范式。接着是涉及的核心概念,把握总体技术方向。最后是各种微调方法,及两大主流核心微调技术的异同点。

具体的各项技术原理概述可以参考整理的系列:
(阅读顺序先prefix tuning后p tuning可以更好梳理各项技术发展脉络及异同)
大模型微调技术系列原理:
大模型微调技术——概述
大模型微调技术——LoRA
大模型微调技术——Prefix Tuning 与 Prompt Tuning总结
大模型微调技术——P-Tuning及P-Tuning v2总结

一、背景

在这里插入图片描述

二、三大认识

在这里插入图片描述

涉及的核心概念

在这里插入图片描述

4. 常见的微调方法

在这里插入图片描述

5.LoRA 和P-Tuning异同

LoRA 和P-Tuning作为两大常见的主流微调技术(p-tuning v2已发布),了解两大技术的异同之处,可以更好了解微调性能差异和微调技术的选择。
在这里插入图片描述

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值