P-tuning、Prompt-tuning和Prefix-tuning区别是什么？

最新推荐文章于 2025-04-16 15:28:26 发布

Jacob_AI

最新推荐文章于 2025-04-16 15:28:26 发布

阅读量1.5k

点赞数 12

文章标签： prompt transformer nlp 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cancer_s/article/details/143625782

版权

概念

Prompt Tuning 是通过在输入序列前添加额外的 Token 来适配下游任务的方法。这些额外的 Token 是可训练的，而预训练语言模型的参数保持不变。
Prefix Tuning 是在每层 Transformer 结构的输入前添加一组可训练的 Token。这样，模型在处理输入序列时，每一层的输入都会包含这些额外的 Token，从而适配下游任务。
P-Tuning 是 Prompt Tuning 的一种变体，其核心思想是在特定位置插入可训练的 Token，使模型能够更好地理解下游任务的需求。P-Tuning 方法通过在输入序列中间插入额外的 Prompt Token，使模型在处理输入时能更好地捕捉上下文信息。

Prefix Tuning对比P-tuning

Prefix Tuning是将额外的embedding加在开头，看起来更像模仿Instruction指令，而P-tuning位置不固定；
Prefix Tuning通过在每个层都添加可训练参数，通过MLP初始化，而P-Tuning只在输入的时候加入embedding，并通过LSTM或MLP初始化。

Prefix Tuning对比Prompt-tuning

Prompt Tuning方式可以看做是Prefix Tuning的简化，只在输入层加入 prompt tokens，并不需要加入MLP进行调整（MLP处理prefix得到hidden state）来解决难训练的问题。

P-tuning和Prompt-tuning的区别

P-Tuning在输入的时候加入embedding，并通过LSTM或MLP初始化，且位置不固定，后续的版本中在每个层也都加了embedding，而prompt-tuning值在输入加上虚拟的token来学习，还不是自由参数形式。

博客等级

码龄5年

57
原创

857
点赞

570
收藏

467
粉丝

关注

私信

热门文章

分类专栏

大模型 2篇

展开全部收起

最新评论

大模型 VS 大语言模型
Jacob_AI: 补充一下：大模型是一种基于大量数据训练的人工智能模型，具有强大的下游任务自适应能力。相对于传统的人工智能模型，大模型可以处理更多的领域和任务，其优势主要体现在以下几个方面：参数规模大：大模型拥有上亿甚至千亿级的参数，这使得它们可以处理更加复杂和抽象的任务，具有更强的泛化能力。数据依赖性：大模型的训练依赖于大量的数据，这些数据覆盖了各种场景和情况，使得大模型能够更好地理解和处理各种复杂的问题。适应性强：大模型可以适应各种不同的任务和领域，只需要通过少量的样本进行微调，就可以达到很好的效果。对于少量样本的提示，大模型具有以下优势：快速适应：大模型具有很强的泛化能力，少量样本的提示可以使其快速适应新的任务和领域。提高准确度：少量样本的提示可以减少模型的过拟合风险，提高模型的准确度。节省资源：相对于重新训练模型，少量样本的提示可以节省大量的计算资源和时间。综上所述，少量样本的提示对于大模型的回答的准确度具有很大的优势，可以提高模型的适应性和准确度，同时节省资源。
大模型 VS 大语言模型
征途黯然.: 在大模型VS大语言模型方面的专业知识令人钦佩，文章非常有价值。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。