一些NLP术语

最新推荐文章于 2024-08-22 23:59:32 发布

OPTree412

最新推荐文章于 2024-08-22 23:59:32 发布

阅读量501

点赞数 1

分类专栏：基本知识文章标签：自然语言处理人工智能深度学习

本文链接：https://blog.csdn.net/CSTGYinZong/article/details/129044356

版权

4 篇文章 0 订阅

订阅专栏

文章介绍了NLP中的关键概念，包括预训练用于初始化模型，微调适应新任务，下游任务是应用预训练模型到实际问题，少样本学习允许模型从少量新类别数据中学习，以及Prompt技术如何将任务转化为自然语言提示以利用大模型的潜力。

摘要由CSDN通过智能技术生成

pre-training（预训练）

为一个任务来训练模型，将效果不错的模型参数保存下来，以后想要执行相似任务的时候直接拿过来用，并且能够获得较好的结果。这个过程就是pre-training。

假如说你已经有了一个猫脸识别的预训练模型，你想把这个模型来处理别的任务，比如说人脸识别。这个时候，你可以直接使用之前保存下来的模型的参数来作为这一任务的初始化参数，然后在训练的过程中，依据结果不断进行一些修改。这个过程就是fine-tuning。

真正想要解决的任务。首先使用公共数据集进行训练，而这些数据集可能不会很好完成你真正想完成的内容，这就意味着在解决的实际问题的数据集上，要微调这个预训练模型，而这个任务称为下游任务。

模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习

k-way n-shot support Set：Support Set 就是帮助模型去分辨新类别的小样本数据集。k 代表小样本中类别的数量，n 代表每个类别有多少数据。例如，有3个类别，每个类别只有一个样本，那么就是 3-way one-shot.

k-way: k 的数量越多，分类准确率越低
n-shot: n 的数量越多，分类准确率越高

具体做法：

随着预训练语言模型体量的不断增大，对其进行fine-tune的硬件要求、数据需求和实际代价也在不断上涨。除此之外，丰富多样的下游任务也使得预训练和微调阶段的设计变得繁琐复杂，因此研究者们希望探索出更小巧轻量、更普适高效的方法，Prompt就是一个沿着此方向的尝试。

简单来说，用户用一段任务描述和少量示例作为输入，然后用语言模型生成输出。这种方法就叫做in-context learning或prompting。

假设我们要对一句话Best pizza ever!进行情感分类，可以在这句话后面加上一句模板:

Best pizza ever! It was ___.

那么基于前面这句话填空的结果，模型预测为great的概率要远高于bad。因此我们可以通过构造合适的Prompt把情感分类问题变成完形填空问题，从而可以很好地利用预训练模型本身的潜力。

https://zhuanlan.zhihu.com/p/386470305

关注

专栏目录