神经网络微调技术全解（03）-Prompt Tuning全面解析

最新推荐文章于 2025-04-05 23:39:08 发布

技术与健康

最新推荐文章于 2025-04-05 23:39:08 发布

阅读量1.4k

点赞数 44

分类专栏：神经网络文章标签：神经网络机器学习

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/Practicer2015/article/details/141504644

版权

神经网络专栏收录该内容

8 篇文章 ¥49.90 ¥99.00

订阅专栏

Prompt Tuning是一种旨在通过优化输入文本中的提示来引导大型预训练语言模型（如GPT-3、T5等）在特定任务上表现更好的微调技术。它是一种无需修改模型内部参数的轻量级微调方法，特别适用于处理不同任务或领域的情境。

1. 背景

在传统的全参数微调中，所有模型参数都会根据特定任务的数据进行微调。虽然这种方法可以使模型更好地适应任务，但它的计算成本高，并且在多任务场景下，需要为每个任务存储和管理不同的模型版本。

Prompt Tuning则采用了一种更为高效的方法，通过优化少量提示（Prompt）来引导模型完成任务，避免了对模型全部参数的修改。

2. 核心思想

Prompt Tuning的核心思想是将任务信息嵌入到输入文本中，而不是依赖模型的参数调整。通过优化提示，模型可以更好地理解任务上下文，并生成与任务相关的输出。提示的设计与优化成为模型表现的关键。

3. Prompt Tuning的实现机制

3.1 提示设计

静态提示（Fixed Prompts）

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

技术与健康

关注关注

44
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

神经网络微调技术全解（05）-- Learnable Prompts vs Prefix Tuning

技术与健康

08-28

949

是一种更为通用的概念，允许在输入文本前后插入可训练提示，并且在模型输入层进行优化。它的应用范围较广，但影响主要局限于输入表示。

神经网络微调技术全解（04）-- Prompt Tuning-可训练提示（Learnable Prompts）

技术与健康

08-28

683

可训练提示”（Learnable Prompts）是Prompt Tuning中的一个关键概念。与手动设计的固定文本提示不同，可训练提示指的是一种自动化的、基于学习的提示优化方法。这种提示不再是简单的静态文本，而是通过训练模型来学习的一组向量表示，用以引导模型在特定任务上的输出。可训练提示是Prompt Tuning中的一种关键技术，通过将提示作为可训练的向量而非静态文本，来引导预训练模型更好地完成任务。它的自动化学习过程减少了对人工设计提示的依赖，并且在参数效率和适应性方面表现优异。

参与评论您还未登录，请先登录后发表或查看评论

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）

shanguicsdn000的博客

06-29

1362

（1） Fine-Tuning（标准微调）优点：简单易用：直接在预训练模型上进行微调。适应性强：可以针对特定任务调整整个模型的参数。效果显著：通常能显著提高模型在特定任务上的表现。缺点：计算成本高：需要调整模型的大量参数。数据需求较高：为了有效微调，通常需要较多的标注数据。适用场景：当有足够的标注数据和计算资源时，适用于大多数NLP任务。优点：参数高效：只修改或优化模型的一小部分参数。节省计算资源：比完全微调需要的资源少。

Prompt-Tuning——深度解读一种新的微调范式

热门推荐

夏栀的博客

11-19

7万+

Prompting——深度解读一种全新的微调范式自从GPT、EMLO、BERT的相继提出，以Pre-training + Fine-tuning 的模式在诸多自然语言处理（NLP）任务中被广泛使用，其先在Pre-training阶段通过一个模型在大规模无监督语料上预先训练一个预训练语言模型（Pre-trained Language Model，PrLM），然后在Fine-tuning阶段基于训练好的语言模型在具体的下游任务上再次进行微调（Fine-tuning），以获得适应下游任务的模型。这种模式在诸

LLM高效参数微调方法：从Prefix Tuning、Prompt Tuning、P-Tuning V1/V2到LoRA、QLoRA(含对模型量化的解释)

结构之法算法之道

08-05

1万+

常规部分的正向传播由transformers所定义，而LoRA部分的正向传播则由LinearLayer_LoRA(nn.Module)的forward()所定义，即“LoRA层的两条分支结果进行加和”，如下图所示『一般用随机高斯分布初始化，当然实际代码实现时，比如微软的deepspeed chat在用到LoRA时，一开始通过0矩阵占位，然后调用搭配ReLU激活函数的kaiming均匀分布初始化。，相当于在训练期间，较小的权重矩阵(下图中的A和B)是分开的，但一旦训练完成，权重可以合并到一个新权重矩阵中。

大模型高效参数微调技术（Prompt-Tuning、Prefix Tuning、P-Tuning、LoRA...）

酒酿小圆子呀～

07-13

1383

在整个NLP领域，整个发展历程是朝着精度更高、少监督，甚至无监督的方向发展的。而 Prompt-Tuning是目前学术界向这个方向进军最新也是最火的研究成果。

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）_adapter微调 p tuning

2401_85328934的博客

07-08

1690

大模型参数高效微调技术原理综述（四）-Prompt Tuning

qq_32907491的博客

09-01

1289

首先我们看一下论文摘要，快速理解论文的核心内容问题与一样，都是以任务为中心的思路解决问题。以任务为中心：它们都在试图解决FFT针对不同的下游任务都需产生一个新的微调后大模型而导致的成本效率问题。解决方案：论文提出的，也是一种使用Soft Prompt(软提示)进行迁移学习的方法。统一不同下游任务的训练数据格式，并将这些不同下游任务的训练数据汇总成一个乱序的数据集，微调预训练模型，最终获得一个能处理不同下游任务的大模型。实验效果在小参数规模的T5上，略差于FFT性能。在中参数规模的T5上，

Prompt-Tuning（提示词微调）深度解析：带你看懂从离散到连续提示的技术演进

weixin_41645791的博客

11-28

4721

Prompt-Tuning 是近年来自然语言处理（NLP）领域的一项核心技术，其通过精心设计的提示（Prompt），让预训练模型更高效地适配下游任务，逐渐替代传统的 Fine-Tuning 方法，成为模型微调的高效解决方案。• 模板：“任务：[描述任务目标] 输入：[任务输入] 输出：[任务输出]”：用可训练的向量表示任务提示（Prompt），优化这些向量以适配任务。• 输入：“任务：判断评论的情感输入：我喜欢这部电影。：将分类任务建模为完形填空任务，通过离散 Prompt 优化输出。

# 使用 OpenCV 和神经网络实现图像风格化

www_pp_的博客

03-31

1057

通过 OpenCV 和预训练的神经网络模型，我们可以轻松实现图像风格化的效果。本文介绍了完整的实现过程，包括图像预处理、模型加载、神经网络推理以及输出处理。希望这篇文章对你有所帮助！如果你有任何问题或建议，欢迎在评论区留言。

神经网络与深度学习：案例与实践——第三章（2）

2301_79679684的博客

04-05

174

Logistic回归可以有效地解决二分类问题，但在分类任务中，还有一类多分类问题，即类别数C大于2 的分类问题。Softmax回归就是Logistic回归在多分类问题上的推广。使用Softmax回归模型对一个简单的数据集进行多分类实验。

神经网络能不能完全拟合y=x² ？？？

Listennnn的博客

04-04

962

先说结论：关键看激活函数的选择是的，ReLU神经网络对非线性函数（如yx2）的拟合只能是逼近，而无法实现数学意义上的完全重合。这一结论源于ReLU的分段线性本质与目标函数的非线性结构之间的根本性差异。

神经网络与深度学习：案例与实践——第三章（3）

2301_79679684的博客

04-05

470

Iris数据集，也称为鸢尾花数据集，包含了3种鸢尾花类别（Setosa、Versicolour、Virginica），每种类别有50个样本，共计150个样本。其中每个样本中包含了4个属性：花萼长度、花萼宽度、花瓣长度以及花瓣宽度，本实验通过鸢尾花这4个属性来判断该样本的类别。

【神经网络】python实现神经网络（三）——正向学习的模拟演练

师兄怎么办

04-02

878

有了之前的经验，我们继续手写数字识别的python实现

神经网络基础（NN）

gorgor在码农

03-27

1344

这篇文章详细介绍了神经网络的基础知识、组成要素、优化方法、正则化策略以及一个完整的案例——使用神经网络构建手机价格分类模型。文章从神经网络的定义、神经元模型讲起，逐步深入到激活函数、权重初始化、损失函数、优化器等内容，并通过手机价格分类案例展示了从数据预处理到模型构建、训练、优化和部署的全过程，适合深度学习初学者系统学习。

神经网络基础

最新发布

qq_68916866的博客

04-05

177

一个神经元：单层神经网络：多层神经网络：（前向计算）

神经网络与深度学习：案例与实践——第三章(1)

2301_79679684的博客

04-04

662

主要任务：实现一个Logistic回归模型，并对一个简单的数据集进行二分类实验。先构建一个简单的分类任务，并构建训练集、验证集和测试集。本任务的数据来自带噪音的两个弯月形状函数，每个弯月对一个类别。我们采集1000条样本，每个样本包含2个特征。 ①数据集构建函数：具体讲解在代码内部. ②随机采集1000个样本，之后进行可视化。 ③将1000条样本数据拆分成训练集、验证集和测试集，其中训练集640条、验证集160条、测试集200条。现在，完成了数据集的构建Logistic回归是一种常用的处理二分类问题的线

吴恩达深度学习复盘(5)神经网络的前向传播TesorFlow与NumPy实现比对

wgc2k的博客

04-02

1193

数据表示的历史背景NumPy 是 Python 科学计算的基础库，早期设计为处理多维数组TensorFlow 由 Google Brain 团队开发，采用张量（Tensor）作为核心数据结构两者在矩阵存储方式上存在历史遗留的不一致性矩阵维度的关键概念矩阵维度表示为行数×列数（如 2×3 矩阵）行向量（1×n）与列向量（n×1）的区别NumPy 一维数组（ndarray）与二维矩阵的差异数据输入的维度规范性框架间转换的显式处理历史设计差异带来的潜在问题。

深度学习入门：从神经网络基础到简单实现

Programming Talk

04-01

435

本文介绍了深度学习的基本概念，并通过实现一个全连接神经网络展示了深度学习模型的构建、训练和评估流程。我们从简单的神经网络开始，逐步引入了激活函数、损失函数、优化器等关键概念，并探讨了防止过拟合和提升模型性能的各种技术。深度学习虽然强大，但也面临一些挑战。深层网络需要大量数据和计算资源进行训练，模型的可解释性也相对较差。未来的发展方向包括更高效的网络结构设计、自监督学习、元学习等新兴领域。对于初学者来说，理解基础概念并动手实践是最重要的第一步。

prompt-tuning

02-27

### 提示调整概述提示调整是一种新兴的技术，在自然语言处理领域内用于改进预训练模型的表现。不同于传统的微调方法，提示调整专注于修改输入给模型的文本形式——即所谓的“提示”，而不是直接改变模型参数[^1]。在提示调整的过程中，通常会引入一些特定于任务的标记或短语作为前缀附加到原始输入之上。这些额外加入的内容旨在引导模型更好地理解上下文并作出更恰当的回答。对于某些复杂的NLP应用场景来说，这种方法能够显著提升性能而不必重新训练整个神经网络结构。 #### LAMM框架下的提示调整实践具体而言，在多模态场景下，LAMM（Label Alignment for Multi-Modal Prompt Learning）提供了一种新颖的方式来进行提示调整。该方法特别适用于像CLIP这样的视觉-语言模型，其核心思想在于通过对类别标签进行编码来优化提示模板，从而使得模型能够在面对新任务时更加灵活高效地做出反应[^2]。 ```python class LAMMPromptTuning: def __init__(self, model, class_labels): self.model = model self.class_embeddings = {label: torch.nn.Parameter(torch.randn(768)) for label in class_labels} def forward(self, image_features): logits = [] for cls_emb in self.class_embeddings.values(): prompt_embedding = torch.cat([image_features, cls_emb.unsqueeze(0)], dim=-1) logit = self.model(prompt_embedding).squeeze() logits.append(logit) return torch.stack(logits) # 使用实例化后的对象进行推理 lammp_tuner = LAMMPromptTuning(pretrained_clip_model, ["dog", "cat"]) output_logits = lammp_tuner.forward(image_feature_vector) ``` 上述代码展示了如何基于LAMM实现一个多模态提示调整器。这里`pretrained_clip_model`代表已经过大规模数据集预训练得到的基础模型；而`["dog", "cat"]`则是目标分类任务所涉及的具体类别名称列表。通过这种方式定义了一个新的模块，可以在保持原有架构不变的情况下仅针对少量新增参数执行梯度下降操作，进而达到快速适应不同下游任务的目的。