大型语言模型综述（二）

AI智韵

已于 2023-06-27 06:01:41 修改

阅读量9.3k

点赞数

分类专栏：高质量AI论文翻译文章标签：语言模型人工智能深度学习

于 2023-05-30 07:10:16 首次发布

不能复制，转发

本文链接：https://blog.csdn.net/m0_47867638/article/details/130940236

版权

高质量AI论文翻译专栏收录该内容

173 篇文章 23 订阅 ¥99.90 ¥299.90

订阅专栏

文章目录

5 . LLMS自适应调优
6、利用
8、结论及未来发展方向

5 . LLMS自适应调优

经过预训练，LLMs可以获得解决各种任务的一般能力。然而，越来越多的研究表明，LLM的能力可以根据特定的目标进一步适应。本节介绍两种主要的自适应预训练LLMs的方法，即指令调优和对齐调优。前者主要旨在增强(或解锁)LLMs的能力，后者旨在使LLMs的行为与人类的价值观或偏好保持一致。此外，我们还将讨论快速模型自适应的有效调优。接下来，我们将详细介绍这三个部分。

5.1指令调优

本质上，指令调优是在一组自然语言形式的格式化实例上微调预训练LLMs的方法[62]，这与监督微调[61]和多任务提示训练[28]高度相关。为了执行指令调优，我们首先需要收集或构建指令格式的实例。然后，用这些格式化的实例以监督学习的方式进行微调(例如，用序列到序列损失进行训练)。经过指令调优后，LLMs可以表现出优越的能力来泛化到未见过的任务[28,62,64]，即使在多语言设置中[84]。

最近的一项综述[214]对指令调优的研究进行了系统的概述。主要关注指令调优对LLMs的影响，并为实例收集和调优提供了详细的指南或策略。此外，还讨论了如何使用指令调优来满足用户的实际需求，这已经广泛应用于现有的LLMs中，如InstructGPT[61]和gpt - 4[46]。

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
大型语言模型综述（二）

文章目录5 . LLMS自适应调优5.1指令调优5.1.1、格式化实例构造5.1.2指令调优策略5.1.3、指令调优的效果5.2、对齐调整5.2.1、比对的背景和标准5.2.2、收集用户反馈5.2.3、基于人工反馈的强化学习5.3、高效调优5.3.1、参数高效的微调方法5.3.2 LLMs上的参数高效微调6、利用6.1、情境学习6.1.1、提示制定6.1.2、论证设计6.1.3、底层机制6.2、思维链提示6.2.1、基于CoT的情境学习6.2.2、CoT的进一步讨论7、能力评价7.1、基本评估任务7.1.1
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI智韵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。