大语言模型的预训练[5]：语境学习、上下文学习In-Context Learning：精调LLM、Prompt设计和打分函数（Scoring Function）设计以及ICL底层机制等原理详解

最新推荐文章于 2025-03-18 16:30:54 发布

汀、人工智能

最新推荐文章于 2025-03-18 16:30:54 发布

阅读量2.1k

点赞数 1

分类专栏： LLM技术汇总文章标签：语言模型 prompt 人工智能上下文学习语境学习 NLP ICL

涉及博主原创类文章，未经博主许可不允许转载

本文链接：https://blog.csdn.net/sinat_39620217/article/details/131803162

版权

LLM技术汇总专栏收录该内容

82 篇文章 ¥29.90 ¥99.00

订阅专栏

In-ContextLearning允许语言模型通过少量示例快速适应新任务，无需微调。文章介绍了ICL的背景、定义，与提示学习、小样本学习的区别，并探讨了预训练如何影响ICL效果。优化方法包括模型预热和推理阶段的Prompt设计及打分函数选择。尽管存在对context敏感、性能饱和等问题，但ICL在NLP任务中展现出潜力，并有望促进更高效的模型应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大语言模型的预训练[5]：语境学习、上下文学习In-Context Learning：精调LLM、Prompt设计和打分函数（Scoring Function）设计以及ICL底层机制等原理详解

1.In-Context Learning背景与定义

背景

大规模预训练语言模型（LLM）如 GPT-3 是在大规模的互联网文本数据上训练，以给定的前缀来预测生成下一个 token（Next token prediction）。通过预测词的训练目标、大规模数据集以及超高参数量的模型相结合，产生了性能极强的 LLM，它可以 “理解” 任何文本输入，并在其基础上进行“写作”，除此以外，GPT-3 的论文发现，大规模的训练数据会产生一种有趣的新兴行为，称为 In-Context Learning（又称上下文学习，语境学习， ICL），他并不需要调整模型参数，仅用几条下游任务的示例就可以取得极佳的结果。

定义

In-Context Learning 最初是在原始 GPT-3 论文中作为一种大语言模型学习任务的方式而被推广的，能够直接让语言模型根据给定的

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

汀、人工智能 十分感谢您的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。