大模型微调技术——概述

爪哇 o_O

已于 2023-08-16 21:34:54 修改

阅读量1.3k

点赞数 3

文章标签： nlp 人工智能语言模型 chatgpt gpt-3

于 2023-08-16 21:16:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41838627/article/details/132327479

版权

在这里插入图片描述
大语言模型推动新一波AI的火热发展，呈现百发齐放的趋势。“预训练+微调”技术，可以让百亿级语言模型短时间内解决不同下游任务的需求(金融、医疗、法律)，极大提升了企业开发效率，甚至极有可能短时间内颠覆一家企业。本文对“微调技术”进行整体概述，首先汇总技术发展的背景和主流的脉络，正确看待大模型潜力和微调技术。其次是对微调技术的三大认识：三部曲（学习路线）、LLM训练、AI应用开发新范式。接着是涉及的核心概念，把握总体技术方向。最后是各种微调方法，及两大主流核心微调技术的异同点。

具体的各项技术原理概述可以参考整理的系列：
（阅读顺序先prefix tuning后p tuning可以更好梳理各项技术发展脉络及异同）
大模型微调技术系列原理：
大模型微调技术——概述
 大模型微调技术——LoRA
大模型微调技术——Prefix Tuning 与 Prompt Tuning总结
 大模型微调技术——P-Tuning及P-Tuning v2总结

一、背景

在这里插入图片描述

二、三大认识

在这里插入图片描述

涉及的核心概念

在这里插入图片描述

4. 常见的微调方法

在这里插入图片描述

5.LoRA 和P-Tuning异同

LoRA 和P-Tuning作为两大常见的主流微调技术（p-tuning v2已发布），了解两大技术的异同之处，可以更好了解微调性能差异和微调技术的选择。
在这里插入图片描述

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。