P-Tuning v2 vs Prefix-tuning

YummyJacky

已于 2024-03-25 15:44:01 修改

阅读量576

点赞数 8

分类专栏：大模型文章标签：人工智能

于 2024-03-25 15:29:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53697800/article/details/137014889

版权

大模型专栏收录该内容

6 篇文章 1 订阅

订阅专栏

内容来自于学习知乎相关问题回答后，汇总如下

《Prefix-Tuning: Optimizing Continuous Prompts for Generation》

《P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks》

在P-tuning v2文章中有说"Technically, our approach P-tuning v2 is not conceptually novel. It can be viewed as an optimized and adapted implementation of Deep Prompt Tuning (Li and Liang, 2021; Qin and Eisner, 2021) designed for generation and knowledge probing."。其中Li and Liang 2021就是Prefix-tuning。

当基座是 GPT-2 / BART 等 NLG 模型时，它叫 Prefix-tuning；如果换到 BERT / RoBERTa / DeBERTa 来做 NLU 任务，那么就改名为 P-Tuning-v2。

总的来说，相较于Prefix-tuning，P-tuning v2主要是针对NLU任务做了两点修改：

1.针对NLU任务去除reparameterization

重参数化(Reparameterization)即Prefix-Tuning 放在PrefixEncoder里的MLP层，然而P-tuning作者发现MLP的作用在不同的任务和数据集上有区别，在比如BoolQ and CoNLL12上有负作用。因此P-tuning v2中就把这个给去掉了，也就是那个MLP或者LSTM。

2.在进行NLU任务的过程中，采用与BERT中一样的MLP分类头而不是verbalizers,即Verbalizer + LM head” 调整成 “CLS + MLP head”

因为verbalizers不适合序列标注问题，使用分类头使得其适用于NLU任务

关注

8
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

YummyJacky CSDN认证博客专家 CSDN认证企业博客

码龄4年

21: 原创

12万+: 周排名

5万+: 总排名

2万+: 访问

: 等级

471: 积分

122: 粉丝

125: 获赞

6: 评论

223: 收藏

私信

关注

热门文章

分类专栏

最新评论

大模型面试题（四）
CSDN-Ada助手: 恭喜您发布了第13篇博客“大模型面试题（四）”，持续创作不易，您的努力和热情让我们受益匪浅。希望您能继续保持对技术的热爱和探索精神，也期待您在未来的创作中能够加入更多实际案例分析、解决方案探讨等内容，让读者能够更深入地理解和应用所学知识。期待您的下一篇作品！
思维链(CoT)&思维树(ToT)
CSDN-Ada助手: 恭喜作者创作了第11篇博客，内容涉及到思维链(CoT)和思维树(ToT)，展示了对于思维模式的深入思考和探索。希望作者可以继续保持对于这一主题的研究，不断拓展思维的边界。建议下一步可以尝试探讨不同思维模式之间的联系与转化，或者深入探讨思维链与思维树在实际生活中的应用场景，为读者提供更多启发和思考。期待作者的精彩续篇！
大模型面试题（三）
CSDN-Ada助手: 恭喜用户发布了第12篇博客“大模型面试题（三）”，内容相当精彩！您对面试题的深度剖析和解析让读者受益匪浅。希望您能继续保持创作的热情和耐心，坚持分享更多有价值的内容。对于下一篇博客，或许可以考虑加入一些实例分析或者案例分享，让读者更有实践性的收获。期待您的下一篇作品！
P-Tuning v2 vs Prefix-tuning
CSDN-Ada助手: 恭喜您发布了第9篇博客“P-Tuning v2 vs Prefix-tuning”！您对不同调优方法的比较分析很有深度，让读者受益匪浅。希望您能继续保持创作热情，分享更多有价值的内容。或许在未来的文章中可以探讨一些实际案例，以及对新兴技术的前瞻性思考，这样能够更好地吸引读者的注意。期待您的下一篇作品！祝您创作顺利！
大模型面试题（一）
CSDN-Ada助手: 恭喜您写下了第8篇博客“大模型方向实习准备”！不断分享经验和心得是非常有价值的，也能帮助更多人了解这个领域。接下来，或许可以考虑分享一些具体的实习经历和心得体会，让读者更深入地了解实习过程中的挑战和收获。期待您的下一篇博客！祝您继续保持创作的热情和努力！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。