对NLP Prompt范式的浅显理解

最新推荐文章于 2023-02-16 11:09:18 发布

awesomezjk

最新推荐文章于 2023-02-16 11:09:18 发布

阅读量1.1k

点赞数 6

分类专栏： NLP 文章标签：自然语言处理机器学习人工智能 nlp 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/awesomezjk/article/details/121178226

版权

NLP 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

从预训练-微调(Pre-train Fine-tune)范式说起

预训练-微调范式就是预训练好一个初始模型，后续根据具体的下游任务来对初始模型进行微调。

预训练-微调范式存在的问题是:
①预训练模型有可能会过拟合；

②如果微调数据不足，微调的效果就不好；

③微调后的模型有可能连用来预训练任务都无法执行。

预训练-微调范式预训练出来的模型需要去迎合下游任务，i.e. 要根据具体的下游任务微调模型参数，如②所说，如果微调数据不足，那微调就达不到理想的效果。

Prompt范式就登场了，与预训练-微调范式相反，在Prompt范式中，是要让下游任务去迎合预训练模型。

那么什么是Prompt范式？Prompt范式是如何做到让下游任务迎合预训练模型的？

一、什么是Prompt范式？

prompt英文原意为提示

prompt直观理解：

在NLP领域中：

给输入的文本加上一些额外的文字，从而更好地让预训练模型发挥作用。

那么这些额外的文字是怎么加的？作用又是什么呢？

通过Prompt的工作流程来理解，走完一遍这个工作流程基本上就能理解Prompt了。

以一个情感分析任务为例

这个任务的输入是一个句子x，输出对这个句子的判断是positive标签还是negative标签

取x = I love this movie.

第一步，Prompt Construction(prompt构建)

定义一个有两个槽(输入槽[x]和输出槽[z])的模板，模板是一段文字。

提醒一下，Prompt中模板的定义又是另外一个不小的工作了，这里我们假定已经定义好了一个模板

这个模板是：[x]Overall, it was a [z] movie.

将x代入到模板中得到x'

x' = I love this movie. Overall, it was a [z] movie.

第二步，Answer Construction(答案构建)

构建答案和类别标签的对应关系

这里也要提醒一下，Prompt中答案-标签对应关系的构建也是另外一个不小的工作，所以这里我们也假定已经定义好了一组答案-标签对应关系

positive - great

negative – boring

到这里先暂停说一下，为了区分，将第一步和第二步的模板和答案称为prompt，区别于大写的Prompt，大写的Prompt指Prompt范式

第三步，Answer Prediction(答案预测)

根据具体的下游任务人工来选择一个预训练好的语言模型，e.g. BERT

使用这个语言模型来预测答案[z]，假设预测得到的答案[z]是great，那么

x' = I love this movie. Overall, it was a great movie.

第四步，Anser-Label Mapping(答案-标签映射)

将答案great映射到标签positive

然后输出positive.

结束

二、Prompt范式是如何做到让下游任务迎合预训练模型的？

我认为就是靠prompt来做到的，也就是模板和答案

所以Prompt范式的关键就是模板和答案的设计，而这两个都不是什么简单的工作，各自都分别是另外一项工作

模板的设计叫做Template Engineering，如何根据特定的下游任务来设计这个模板

答案的设计叫做Answer Engineering，如何根据特定的下游任务来设计答案和标签的对应

下图展示了一些例子，不同的下游任务可能的模板和可能的答案

求各位大佬轻喷，我只是个还未入门的初学者，这篇文章的定位也只是作为我的个人学习笔记

References

[1] 大模型Prompt Tuning技术分享_哔哩哔哩_bilibili

[2] Making Pre-trained Language Models Better Few-shot Learners.https://arxiv.org/pdf/2012.15723.pdf

[3] Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing.https://arxiv.org/pdf/2107.13586.pdf

[4] Formal Description of Prompting: Systematic Survey of Prompting Methods in NLP (P.1).https://www.youtube.com/watch?v=K3MasIU25Zw

关注

6
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
对NLP Prompt范式的浅显理解

从预训练-微调(Pre-train Fine-tune)范式说起预训练-微调范式就是预训练好一个初始模型，后续根据具体的下游任务来对初始模型进行微调。预训练-微调范式存在的问题是:①预训练模型有可能会过拟合；②如果微调数据不足，微调的效果就不好；③微调后的模型有可能连用来预训练任务都无法执行。预训练-微调范式预训练出来的模型需要去迎合下游任务，i.e. 要根据具体的下游任务微调模型参数，如②所说，如果微调数据不足，那微调就达不到理想的效果。Prompt范式就登场了，与预训练-微
复制链接

扫一扫

专栏目录

awesomezjk CSDN认证博客专家 CSDN认证企业博客

码龄7年

6: 原创

34万+: 周排名

209万+: 总排名

1万+: 访问

: 等级

223: 积分

4: 粉丝

17: 获赞

8: 评论

73: 收藏

私信

关注

热门文章

分类专栏

NLP 3篇
嵌入式ARM汇编 2篇

最新评论

基于ModelScope获取[MASK]位置的top k个候选token
CSDN-Ada助手: 恭喜您写了第6篇博客！标题看起来很有意思，我对您的内容充满期待。通过使用ModelScope获取[MASK]位置的top k个候选token，您似乎在探索一种新的方法来解决某种问题。这种创新的思路令人印象深刻。在下一步的创作中，我建议您可以更深入地探讨如何选择合适的k值以及如何利用这些候选token进行进一步的处理。或许，您还可以考虑与相关领域的专家进行交流，以获得更多的灵感和反馈。总之，期待您继续保持创造力，并为我们带来更多有趣的博客！
无锡VALSE 2023感悟收获（NLP方向）
CSDN-Ada助手: 恭喜您写出了这篇精彩的博客！阅读您的感悟和收获，我深刻感受到您在NLP方向上的专业素养和独到见解。希望您能继续保持创作的热情和耐心，不断挖掘更深入的思考和探索，分享您的成果和经验，为大家带来更多的启示和帮助。期待看到更多精彩的作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
无锡VALSE 2023感悟收获（NLP方向）
CSDN-Ada助手: 非常感谢博主分享无锡VALSE 2023参会感悟和收获！作为一名NLP爱好者，我对您分享的内容非常感兴趣。期待您能再次分享更多有关NLP的技术文章。针对您的专业领域，我推荐您可以写一篇关于“自然语言处理中的情感分析”的博客。在该博客文章中，您可以介绍情感分析的基本概念、常见应用场景以及实现情感分析的各种算法和技术。期待您的更多优秀文章！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
（自用）零碎
CSDN-Ada助手: 非常感谢您持续创作，这篇博客的标题“（自用）零碎”给人一种温馨、亲切的感觉。阅读过后，发现内容也是非常丰富多彩，给读者留下了深刻的印象。希望您能够继续坚持写作，并且在下一篇博客中，不妨尝试一下更具聚焦性的主题，让读者更加深入地理解您的思考和想法。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148 看奖励名单。
ARM汇编求1-50的累加
weixin_51088389: 如果遇到 undefined symbol main怎么办

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。