清华p-tuning | GPT也能做NLU？清华推出p-tuning方法解决GPT系列模型fine-tuning效果比BERT差问题

最新推荐文章于 2024-09-05 07:00:00 发布

HxShine

最新推荐文章于 2024-09-05 07:00:00 发布

阅读量632

点赞数

分类专栏： llm nlp_paper nlp 文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16949707/article/details/130817814

版权

nlp 同时被 3 个专栏收录

97 篇文章 3 订阅

订阅专栏

75 篇文章 7 订阅

订阅专栏

23 篇文章 1 订阅

订阅专栏

文章介绍了P-tuning技术，这是一种改进预训练模型如GPT在自然语言理解任务上性能的方法。通过构造可训练的连续promptembedding，避免了传统Fine-tuning的局限性，特别是在LAMA和SuperGlue任务上，GPT在使用P-tuning后，性能显著提升，甚至超过了BERT。此外，该方法也增强了BERT的few-shot学习能力，减少了对prompt工程的依赖。

摘要由CSDN通过智能技术生成

一、概述

title：GPT Understands, Too

论文地址：https://arxiv.org/abs/2103.10385

代码：https://github.com/THUDM/P-tuning

1.1 Motivation

GPTs模型利用传统的fine-tuning技术在NLU任务上效果比较差，比同等量级的BERT效果要差。

1.2 Methods

提出了新的P-tuning方法，构造一个可训练的连续prompt embedding，通过在连续空间中搜索更好的提示语prompt，来提升预训练模型的NLU能力。

1.3 Conclusion

在知识探针检查任务LAMA上，zero shot条件下GPT复原了64%（P@1），提升了20+个点。
在SuperGlue任务下，GPTs系列模型取得了可比的甚至超过BERTs系列监督学习的水平。
P-tuning也提升了BERTs系列模型few-shot和监督学习的表现，同时大幅降度prompt工程的需求。
P-tuning在SuperGlue任务上取得了sota的few-shot表现。

二、详细内容

1. 效果对比

模型大小为110M时，原始Fine-tuning方法中，在SuperGlue任务中，GPT效果比BERT效果差的比较多，使用P-tuning方法后，GPT反而比BERT效果好，同时BERT模型效果也比Fine-tuning效果好。
模型大小为340M时，GPT效果的提升更大。

2. 模型结构

Discrete Prompt Search（离散prompt搜索）：原来的方法需要人工设置比较好的模板，来抽取得到正确的答案。

- context：上下文，例如Britain
- target：预测目标
- （a）黄颜色为prompt token，只能收到离散的反馈

P-tuning

- 利用embedding构建pseudo prompts，可以自动搜索最佳的prompt，提升效果。
- 也可以加一下anchor tokens例如（b）中蓝色Britain提升效果。

3. LAMA数据集表现

MP：人工prompt
FT：Fine-tuning方法，全量参数微调
MP+FT：人工prompt+fine-tuning增强
P- tuning：本文方法
结论：比所有离散prompt搜索方法都要好很多

4 SuperGlue数据集表现

比较了base版本和large版本，GPT-P-tuning的效果比fine-tune版本好很多，甚至有些能超过同等尺寸BERT fine-tune效果。

5 few-shot效果

32 few-shot的效果也还不错，比之前的PET系列的方法都要提升不少。

与人工设计的prompts方法和tuned prompts方法对比，在RTE任务上表现好不少。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。