NLP 中的 prompt 笔记

yichudu

已于 2023-03-21 15:32:31 修改

阅读量1.1k

点赞数

分类专栏： NLP 文章标签：自然语言处理人工智能

于 2023-02-16 11:09:18 首次发布

天天开心

本文链接：https://blog.csdn.net/chuchus/article/details/129057101

版权

NLP 专栏收录该内容

34 篇文章

订阅专栏

Prompt是NLP中的一种技术，它将多种任务转化为预训练模型更熟悉的完形填空形式，提高模型的泛化能力。通过模板和填充函数，Prompt可用于各种下游任务，如情感分析。AnswerSearch寻找最高概率的答案，AnswerMapping处理多个答案与同一输出的映射关系。该方法减少了对标注数据的依赖，推动了预训练模型的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一. 什么是 prompt

NLP 中, 一种用于 Language Model 的 Pretrained Task 范式. 中文直译为"提示".

前辈的特点是, 通过 引入多种任务构造辅助 loss, 让模型去适配这些任务. 流程是 “pre-train, fine-tune, and predict”.
而 prompt 的思路则与此相反, 将多种任务重新组织成完形填空的形式, 使其更接近于原始预训练任务(如 masked LM). 流程是 “pre-train, prompt, and predict”.

其优点是, 得到的模型更通用, 一个完全无监督训练的PLM可以被用来解决各种各样的下游任务.

历史演进

2017-2019, 研究者们的重心逐渐从传统 task-specific 的有监督模式转移到预训练上. 这是因为前者依赖大量的标注数据, 但很多时候是没有足够的数据的. 这个痛点促进了 pre-train 任务范式的诞生.

通过选取合适的prompt，我们可以控制模型预测输出，从而一个完全无监督训练的PLM可以被用来解决各种各样的下游任务。

二. 正式化的描述

先看一个例子

情感分析任务中, 输入 x 是一句文本, 输出 Y = {++, +, ~ , -, --}, 代表情感在高兴/正向的程度上逐渐递减.
那么具体一条样本就是:

x: I love this movie.
y: ++ (very positive)

通常按照多分类去建模.
有了 prompt 后

x’: I love this movie. Overall, it was a [Z] movie.
z: good

根据这个例子, 下面引入符号与概念.

Template

通过 prompt 函数将原始输入作转换 $x' = f_{prompt}(x)$ . 而函数中会用到模板, 上例中的 template 就是:
[X] Overall, it was a [Z] movie.

[X]: 表示原始输入 x 的占位符.
[Z]: 模板中的一个 slot (槽位), 用于放入答案.

当 [Z] 被填充后, 就称为 filled prompt, 填充函数描述为 $f_{\text{fill}}(x',z)$ .

Answer Search

我们先定义 z 的取值集合 Z = {“excellent”, “good”, “OK”, “bad”, “horrible”} 依次对应原始情感分类任务中的 Y = {++, +, ~ , -, --}.
Answer search 过程, 就是在集合 Z 中找出概率最高的 $\hat z$ .
$\hat{\boldsymbol{z}}=\underset{\boldsymbol{z} \in \mathcal{Z}}{\operatorname{search}} P\left(f_{\text {fill }}\left(\boldsymbol{x}^{\prime}, \boldsymbol{z}\right) ; \theta\right)$