CMU预训练模型最新综述：自然语言处理新范式—预训练、Prompt和预测

最新推荐文章于 2024-07-10 11:14:50 发布

PaperWeekly

最新推荐文章于 2024-07-10 11:14:50 发布

阅读量2.7k

点赞数

文章标签：人工智能机器学习深度学习自然语言处理编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/119336766

版权

本文综述了自然语言处理的新范式——预训练、Prompt和预测，探讨了如何使用预训练语言模型进行少样本或零样本学习。作者详细介绍了Prompt的数学描述、设计注意事项及方法分类，指出Prompt-based学习可能是NLP领域的又一次重大变革。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者 | 王馨月

学校 | 四川大学本科生

研究方向 | 自然语言处理

概要

本文针对自然语言处理的新范式——我们称之为“prompt-based 学习”，进行了综述与组织。

论文标题：

Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

论文作者：

Pengfei Liu, Weizhe Yuan, Jinlan Fu, Zhengbao Jiang, Hiroaki Hayashi, Graham Neubig

论文链接：

https://arxiv.org/abs/2107.13586

区别于传统的监督学习中训练模型接受输入 x 并将输出 y 预测为 P(y|x)，Prompt-based 学习基于直接对文本概率进行建模的语言模型。为了使用这些模型执行预测任务，使用模板将原始输入 x 修改为具有一些未填充槽的文本字符串 prompt x'，然后使用语言模型对未填充信息进行概率填充以获得最终字符串 x ，从中可以导出最终输出 y。

这个框架强大且有吸引力的原因有很多：它允许语言模型在大量原始文本上进行预训练，并且通过定义一个新的 prompting 函数，模型能够执行少样本甚至零样本学习，可以适应很少或没有标记数据的新场景。

在本文中，我们介绍了这种有发展前途的范式的基础知识，描述了一组统一的数学符号，可以涵盖现有的很多工作；并沿多个维度组织现有工作，例如预训练模型的选择、prompt 和调整策略。为了让感兴趣的初学者更容易接触到该领域，我们不仅对现有工作以及基于 prompt 的概念的高度结构化类型进行了系统综述和，还发布了其他资源，在这个网站中包含了持续更新的综述以及论文列表：

http://pretrain.nlpedia.ai/

引言

NLP 的两次巨变

第一次巨变是“pre-train and fine-tune” 范式，第二次巨变则是目前的 “pre-train, prompt, and predict”。如图，是 NLP 中的四种范式。

Prompting 的正式描述

在传统的 NLP 监督学习系统中，我们采用输入 x（通常是文本），并基于模型预测输出 y。y 可以是标签、文本或其他各种输出。为了学习这个模型的参数

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
CMU预训练模型最新综述：自然语言处理新范式—预训练、Prompt和预测

©PaperWeekly 原创 ·作者|王馨月学校|四川大学本科生研究方向|自然语言处理概要本文针对自然语言处理的新范式——我们称之为“prompt-based 学习”，进行...
复制链接

扫一扫

PaperWeekly CSDN认证博客专家 CSDN认证企业博客

码龄7年

1450: 原创

4957: 周排名

192: 总排名

554万+: 访问

: 等级

4万+: 积分

8689: 粉丝

6595: 获赞

1002: 评论

2万+: 收藏

私信

关注

热门文章

最新评论

NeurIPS 2022｜探明图对比学习的“游戏规则”：谱图理论视角
m0_52089040: 文章中的很多符号不见了
大语言模型之生成/推理：参数与解码策略原理及其代码实现
大袖揽清风。: say进行分词应该是一个token吧。送入网络前的shape不应该是(b,seq_len)吗？讲道理shape应该是(1,1)才对，张量应该是[[1827]]啊？为什么是[[1,1827]]?
字节跳动 2019 ICME 双赛道冠军团队方案分享
weixin_51042469: 博主您好，请问数据集可以分享嘛？
ACL 2024 | OceanGPT（沧渊）：面向海洋科学任务的大型语言模型初探
眕眕: 实测效果：问：直接汇入东海的河流有哪些答：东海沿岸有几个河流直接注入东海。其中一些主要河流包括: 1.松江:位于上海市，长江的主要支流，在上海市区附近汇入东海。 2.长江:世界上第三长的河流，也是长江的主要支流。它发源于中国西南地区，最终在上海市附近汇入东海。 3.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 4.淮阳河:位于中国东部，淮阳河在江苏省的淮安市附近汇入东海。 5.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 6.珠江:珠江是中国的第二长河流，最终在广东省的香港特别行政区附近汇入南海，包括东海。 7.黑龙江:黑龙江是中国最长的河流，最终在黑龙江省的哈尔市附近汇入东海。这些河流在东海沿岸地区起着重要的水循环作用，并对当地的水文和生态平衡产生影响。
科研实习 | 北京大学杨仝教授课题组招聘大模型/机器学习方向暑期科研实习生...
百丽宫顶真: 现在还缺人吗

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。