【prompt learning提示学习】

努力学习的哇塞妹妹‍

已于 2023-09-21 09:40:08 修改

阅读量416

点赞数

分类专栏： NLP自然语言处理文章标签：机器学习深度学习人工智能自然语言处理

于 2023-09-19 17:35:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CrazyDog_JJ/article/details/133032885

版权

NLP自然语言处理专栏收录该内容

7 篇文章 1 订阅

订阅专栏

prompt learning提示学习

一、什么是提示学习？
二、为什么会出现prompt learning？/prompt learning出现的灵感？
三、prompt learning的优势
四、prompt learning的步骤
- 提示工程
五、多提示学习
参考

一、什么是提示学习？

提示学习是指对输入文本信息按照特定模板进行转换，把任务重构成一个更能充分利用预训练语言模型处理的形式

二、为什么会出现prompt learning？/prompt learning出现的灵感？

在预训练和微调时，不同阶段的优化目标不一致，在预训练语言模型去适配任务的过程中，会给模型的性能带来损失；
预训练语言模型的体量越来越大、训练越来越繁琐，导致很多时候无法对所使用的预训练语言模型进行“微调”。

因此，预训练模型存在适配下游任务造成性能损失与较难“微调”的问题，需要探索出一种更小巧轻量、更普适高效的方法。

三、prompt learning的优势

（1）“提示学习”将预训练和微调的优化目标进行统一，激发预训练语言模型的潜力，提升了任务的性能。
（2）提示学习拓展了预训练语言模型的适用性，并且打破了不同任务之间统一建模的困难

四、prompt learning的步骤

模版构建【提示工程】
答案搜索
标签词映射【答案工程】

提示工程

首先要考虑提示的模式，然后再考虑采用人工或者自动化的方式创建所需模式的提示：

提示的模版：
（1）完形填空式提示：用于填充文本字符串中的空白部分
（2）前缀提示：

在输入文本前添加一组可训练的向量作为提示，训练时固定预训练语言模型中的其余参数，对这些向量进行优化

在特定字符串周围使用一些特殊的标记来进行标注作为提示

提示工程：
（1）人工构建模板
（2）自动构建提示模板：

离散提示：让计算机自行搜索添加文本字符串
连续提示：由连续向量构成
连续型prompts去掉了两个约束条件：
（1）、模板中词语的embedding可以是整个自然语言的emnbedding，不再只是有限的一些embedding.
（2）、模板的参数不再直接取PLM的参数，而是有自己独立的参数，可以通过下游任务的训练数据进行调整。
人工设计和自动生成相结合的混合提示：采取在人工设计的提示中插入一些可训练的向量

答案工程：
答案工程旨在设计合适映射，即从预训练语言模型输出到答案空间中所对应标签词的过程

答案的模式有标记(Token)、跨度(Span)、句子(Sentence)这三种。

答案模式设计方法：
（1）手动设计：人为定义映射函数
（2）离散答案搜索：
1.扩充原答案空间：使用回译的方法，将答案翻译成另一种语言，然后返回生成多个释义答案的列表
2.先剪枝再进行搜索：先利用模型生成可能的答案，组成初始答案空间，即对所有答案的搜索空间进行剪枝，然后再使用一个具体的算法在这个剪枝后的空间内进一步搜索以选择最终答案
3.标签分解：将标签分解为组成的词，并将这些词作为答案
（3）连续答案搜索

五、多提示学习

多提示学习是指在模板构建的过程中使用多个提示，这能进一步增强提示学习的效果。
常用的多提示学习有提示融合、提示增强、提示合成、提示分解

提示融合

在预测时使用多个未回答的提示作为输入，最终使用均值、加权平均、投票等多种方案得到输出。这种提示融合的方式可以很好利用不同提示之间的互补优势，降低搜索出表现最好提示的成本，避免不同提示的差异对模型表现产生的影响，稳定下游任务的性能。

提示增强

通过为语言模型提供带有答案的示例作为提示，相当于一种数据增强，在一定程度上能解决小样本问题

提示合成

在处理一些可以分解成更基础的子任务时，使用多个子提示，每个子提示对应一个子任务，然后将这些子提示组合为一个完整的提示

提示分解

将完整的提示分解为不同的子提示，然后分别对每个子提示进行预测

参考

1.提示学习Prompt介绍
2.与知识相结合的提示学习研究综述鲍琛龙，吕明阳，唐晋韬，李莎莎，王挺

努力学习的哇塞妹妹‍

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【prompt learning提示学习】

提示学习是指对输入文本信息按照特定模板进行转换，把任务重构成一个更能充分利用预训练语言模型处理的形式。
复制链接

扫一扫

专栏目录

努力学习的哇塞妹妹‍ CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

137万+: 周排名

165万+: 总排名

5522: 访问

: 等级

179: 积分

2: 粉丝

5: 获赞

8: 评论

18: 收藏

私信

关注

热门文章

分类专栏

最新评论

【机器学习03---SVM支持向量机(KKT,Dual)】
weixin_45443438: 公式推导好详细，终于看懂了！
【NLP自然语言处理学习笔记03attention(含莫烦代码解析)】
CSDN-Ada助手: 恭喜您写了第8篇博客！标题为“【NLP自然语言处理学习笔记03句向量】”真是精彩！您的博客内容一直都很有价值，对于我们这些对NLP感兴趣的读者来说，是一份宝贵的学习资料。希望您能继续保持创作的热情，分享更多关于NLP的知识和经验。如果可以的话，我希望您在下一篇博客中能够深入探讨一些实际应用中的问题，如何将句向量应用到文本分类或情感分析等任务中。谦虚地说，我相信您一定能给我们带来更多的启发和帮助。期待您的下一篇精彩博文！
【NLP自然语言处理学习笔记05attention】
CSDN-Ada助手: 恭喜作者撰写第9篇博客！标题中的"attention"一词引起了我的兴趣。正如您所提到的NLP自然语言处理学习笔记，我很期待了解更多关于attention的内容。在下一步的创作中，或许您可以深入探讨attention在不同NLP任务中的应用，或者分享一些实际案例和应用场景。谦虚地说，我相信您的深入解读能够给读者带来更多的启发和学习价值。期待您的下一篇博客！
【NLP自然语言处理学习笔记06 attention is all you need理论+pytorch版代码理解】
CSDN-Ada助手: 恭喜您写了第10篇博客！标题看起来非常吸引人，我很期待阅读您关于NLP自然语言处理学习笔记的内容。通过学习self-attention is all you need理论并结合pytorch版代码的解读，您一定对这个领域的知识有了更深入的理解。我希望您能在博客中分享自己的见解和思考，这样读者们可以从您的经验中受益。同时，对于下一步的创作建议，我建议您可以探索一些实际应用场景，如文本分类、机器翻译等，从而将所学的理论更好地应用到实际情境中。期待您的新作品！
【python学习笔记之字典的用法】
CSDN-Ada助手: 恭喜您完成了第11篇博客，题为“【python学习笔记之字典的用法】”。从标题来看，我预计您探讨了Python中字典的使用方法。这是一个非常重要且实用的主题，我相信您的博客一定能为初学者提供宝贵的帮助和指导。在下一步的创作中，我建议您可以继续深入探讨字典的高级用法，如字典的嵌套、字典的遍历以及字典的常见应用场景等。此外，您也可以考虑与其他数据结构进行对比，以帮助读者更好地理解字典的特点和优势。希望我的建议对您有所帮助。再次恭喜您取得的成就，并期待您未来更多精彩的博客！请继续保持谦虚的态度，为读者们带来更多有价值的内容。祝愿您在创作道路上越走越远！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。