P-tuning的论文大白话阅读笔记和代码实现

最新推荐文章于 2025-03-12 16:15:21 发布

游离态GLZ不可能是金融技术宅

最新推荐文章于 2025-03-12 16:15:21 发布

阅读量1.8k

点赞数 1

分类专栏： NLP 机器学习文章标签： nlp

本文链接：https://blog.csdn.net/qq_37477357/article/details/125054211

版权

论文阅读笔记

Motivation

新兴的 GPT-3 及其在使用手工prompt模板在few-shot和zero-shot学习方面的成功表明，使用prompt learning的方案可以使大规模自回归预训练模型适用于自然语言理解；
过去的prompt learning方案过度依赖手工设计，针对一些较复杂任务不好设计，且人力成本高，让模型自己学习模板能够在效率和准确性两个维度上给这个任务带来提升。

Method

Architecture

P-tuning模型学习的目标是得到能最大化提示预训练模型根据给定输入 $x$ 预测标签 $y$ 的前缀模板 ${p_1,...,p_m\}$ 。
在这里插入图片描述
为此，模型首先构造这个前缀模板，论文中将输入x插入前缀模板内部，得到 ${p_1,...,p_i,x,p_{i+1},...p_m\}$ 。我认为可以根据需要组合提示模板，输入和输出的位置（注：根据苏剑林大佬的试验前缀效果最优 $^{[2]}$ ）。