Prompt-Tuning（单任务，每个任务需要设计一个prompt）与Instruction Tuning（多任务，经过多任务精调后，可以用于其他任务的zero-shot）

u013250861

已于 2023-06-17 10:22:34 修改

阅读量414

点赞数

分类专栏： # LLM/预训练&SFT 文章标签：人工智能机器学习深度学习

于 2023-05-11 11:22:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/130618042

版权

LLM/预训练&SFT 专栏收录该内容

84 篇文章 64 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

最近大火的Instruction tuning为何频频受到称赞？经过这种方式精调大模型之后，是否可以提升大模型在NLI和阅读理解的表现？

本文作者将带你揭开谷歌Quoc V.Le团队提出精调新范式Instruction tuning的面纱。

一、前言

前两天在Arxiv刷到个比较牛的论文题目：

Finetuned Language Models Are Zero-Shot Learners

是不是跟GPT-3有些像：

Language Models are Few-Shot Learners

以为是蹭热度，就没点进去，结果今天点进去仔细一看，居然出自Quoc V.Le团队：

于是我摆正心态，仔细看了之后还是发现不少东西。这个文章提出了一个Instruction tuning的概念，用这种方式精调大模型之后可以显著提升大模型在NLI和阅读理解的表现：

更重要的是！Open AI居然不谋而合，虽然没发论文࿰

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Prompt-Tuning（单任务，每个任务需要设计一个prompt）与Instruction Tuning（多任务，经过多任务精调后，可以用于其他任务的zero-shot）

最近大火的Instruction tuning为何频频受到称赞？经过这种方式精调大模型之后，是否可以提升大模型在NLI和阅读理解的表现？本文作者将带你揭开谷歌Quoc V.Le团队提出精调新范式Instruction tuning的面纱。一、前言前两天在Arxiv刷到个比较牛的论文题目：Finetuned Language Models Are Zero-Shot Learners是不是跟GPT-3有些像：Language Models are Few-Shot Learners以为是蹭热度，就没点进去，结
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。