Prompt recovery —— Phi2模型

最新推荐文章于 2024-10-01 17:55:56 发布

Liuffet

最新推荐文章于 2024-10-01 17:55:56 发布

阅读量220

点赞数 3

文章标签： prompt 人工智能

本文链接：https://blog.csdn.net/Silver_ljh/article/details/140781922

版权

文章目录

- 概要
- 整体架构流程

概要

在huggingface开源LLM榜单中，看到phi2模型的下载量仅次于Llamma3，并且看到微软在几个公开的基准测试集上进行测试，phi2的效果好于phi1.5，且是基于GPT生成的合成数据进行预训练，于是想尝试一下微调phi2。

整体架构流程

在T4 GPU上使用FP16 phi2-2.7B进行推理，大概消耗VRAM 6个G。

使用QLORA进行微调，需要用给模型加EOS点，将LORA模块加入到QKV和Projection中，用SFT的方式进行微调，用时大概24小时。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Liuffet

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

AIGC实战——自回归模型(Autoregressive Model)

盼小辉丶的博客

01-05

3684

自回归模型 (Autoregressive Model) 通过将生成问题视为一个序列过程来简化生成模型。自回归模型将预测条件建立在序列中的先前值上，而不是一个以随机潜变量为条件。因此，自回归模型尝试对数据生成分布进行显式建模，而不是尝试近似数据分布。在本节中，将介绍一类经典的自回归模型，长短期记忆网络 (Long Short-Term Memory Network, LSTM)，并将 LSTM 应用于生成文本数据。

大模型prompt技巧——思维链（Chain-of-Thought）

yang_daxia的博客

04-02

1230

将问题分解为多个子问题，然后将子问题的答案加入到提示中，继续prompt,可以理解为更细化的多步step-by-step。1、Zero-shot、One-shot、Few-shot 与fintune。3、多数投票提高CoT性能——自洽性（Self-consistency）其次，思维链的应用领域是有限的。prompt的时候给出例子答案，然后再让模型回答。6、用大模型的CoT指导小模型，提升小模型的能力。多个思维链，然后取结果最多的作为最终的。5、将CoT加入fintinue中。低成本的增强已有大模型的能力。

参与评论您还未登录，请先登录后发表或查看评论

Phi-2小语言模型QLoRA微调教程

qq_20144897的博客

01-09

2639

微软发布的Phi-2模型在kaggle平台上的QLoRa微调教程

【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式

机器学习杂货铺1号店

09-29

2052

Prompt tuning是一种高效的LLM下游任务适配方式

prompt learning——你需要掌握的基础知识以及离散型 prompt 的代码

LiQZ的博客

08-19

3559

prompt learning 是这两年很火热的技术，在 few-shot、zero-shot 领域都有很出色的表现。本文简要介绍了何为“预训练”、“微调”、“预训练语言模型”，并且提供了一份离散型 prompt learning 的代码。

【AI大模型】Prompt Engineering

lmj3732018的博客

06-05

7279

提示工程也叫「指令工程」。Prompt 就是你发给大模型的指令，比如「讲个笑话」、「用 Python 编个贪吃蛇游戏」、「给男/女朋友写封情书」等貌似简单，但意义非凡「Prompt」是 AGI 时代的「编程语言」「Prompt 工程」是 AGI 时代的「软件工程」「提示工程师」是 AGI 时代的「程序员」学会提示工程，就像学用鼠标、键盘一样，是 AGI 时代的基本技能提示工程「门槛低，天花板高」，所以有人戏称 prompt 为「咒语」

五、大模型-Prompt

xiaoqi270620903的专栏

03-18

1万+

当使用大型语言模型（如GPT-3）时，"prompt" 是指您向模型提供的输入文本或指令，用于引导模型生成相应的输出。

【LLM】Prompt tuning大模型微调实战

发现问题，并解决问题，批判性思维

07-10

8331

- 给出好的prompt可以让LLM生成更好的答案，反过来想通过LLM帮我们找到好的prompt就是prompt tuning的思路，训练让模型看到新的例子生成prompt，并把该段prompt作为前缀拼接到我们自己的prompt上，送入LLM得到结果 - prompt tuning训练的前缀是向量，所以解释性略差 - 和few show比较：LLM的上下文context长度是有限的（prompt中给出有限的例子，业务复杂时难让模型学习足够多知识），prompt tuning就没有这个限制，只需在训练

构建高性能 Prompt 之路——结构化 Prompt.pdf

09-26

2. **角色**（Role）：明确模型需要扮演的角色，如专家、助手或特定领域的专业人士。 3. **情境**（Context）：提供必要的背景信息，帮助模型理解对话的上下文。 4. **指令**（Statement）：明确要执行的任务，例如...

text2sql 微调教程/大模型prompt engineering 教程

04-12

（2）使用模板化方法：设计一系列模板化的Prompt，覆盖不同类型的查询场景，提高模型的泛化能力。（3）引入外部知识：结合领域知识库或外部资源，为Prompt提供额外的背景信息，提升模型的准确性。

Prompt-Tuning——深度解读一种新的微调范式

最新发布

敲代码别忘了喝上一杯凉白开。

10-01

163

Prompt 模版作为一种结构化工具，旨在为特定角色——本例中的“诗人”——提供明确的指导和框架。这一模版详尽地描绘了诗人的职责、擅长的诗歌形式以及创作规则，使其能在自动化系统中更加精确地执行任务。诗人角色擅长编写现代诗、七言律诗和五言诗，同时强调内容的健康性和积极向上。通过应用 Prompt 模版，用户可以明确指定诗歌的形式和主题，系统则根据这些参数精心创作出匹配的诗歌。这一模版不仅提升了创作的效率，还维护了作品的文学价值和情感深度，展示了技术与传统诗歌艺术的完美结合。

[论文笔记] Chain-of-Thought Reasoning without Prompting

心宝的博客

09-26

212

模型首先识别出说话者有3个苹果，然后识别出爸爸比说话者多2个，即5个苹果，最后将这两个数量相加得到总数8个苹果。这个例子表明，通过探索替代的解码路径，我们可以从预训练的LLMs中提取出有用的推理链，即使没有明确的提示或问题构造。这个例子表明，通过探索替代的解码路径，我们可以从预训练的LLMs中提取出有用的推理链，即使没有明确的提示或问题构造。当然，以下是一个使用CoT（Chain-of-Thought）解码方式的例子，它展示了如何从预训练的大型语言模型（LLMs）中激发推理路径。

入选ECCV 2024！覆盖5.4w+图像，MIT提出医学图像分割通用模型ScribblePrompt，性能优于SAM

HyperAI超神经

09-27

1037

另外，与 SAM 基线相比，93.8% 的参与者更喜欢 ScribblePrompt，因为它可以改善对涂鸦纠正的相应片段，同样有 87.5% 的参与者更喜欢使用 ScribblePrompt 进行基于点击的编辑。该研究展示了牛津大学团队所开发的一款名为Medical SAM 2 的医学图像分割模型，基于 SAM 2 框架设计，通过将医学图像视作视频，不仅在 3D 医学图像分割任务上表现卓越，同时还解锁了一种新的单次提示分割的能力。正所谓条条大路通罗马，人工智能在医学领域的应用无不是为了造福医学，造福社会。

大模型prompt先关

sslfk的博客

09-24

427

n\n从给定的文本中，我们可以抽取以下知识图谱三元组：\n\n```json\n[\n {\"subject\": \"刘德华\", \"predicate\": \"老婆\", \"object\": \"朱丽倩\"}\n]```\n\n文本输入为：北京是中国的首都\n\n从给定的文本中，我们可以抽取以下知识图谱三元组：\n\n。\n\n文本输入：\n\n我很烦，今天的事情太多了。\n\n分类为：\n\n消极\n\n文本输入：\n\n我今天感觉很开心。\n\n分类为：\n\n。

transformer模型做prompt

05-15

Transformer是一种基于自注意力机制的神经网络模型，广泛应用于自然语言处理领域，例如在机器翻译、文本分类、生成式对话等任务中。在prompt生成方面，Transformer可以被用来生成给定输入的自然语言文本，如回答问题、生成摘要、补全句子等。具体来说，为了实现prompt生成，我们可以将需要生成的prompt作为输入传入Transformer模型中，然后利用模型的自注意力机制来关注输入的不同部分，同时生成与输入相关的输出。例如，在回答问题的任务中，我们可以将问题作为输入，并且使用Transformer生成与问题相关的答案。在摘要生成任务中，我们可以将原始文本作为输入，并且使用Transformer生成简短的摘要。当然，为了训练一个Transformer模型来完成prompt生成任务，我们需要一个大规模的数据集和一个合适的损失函数。通常来说，我们可以使用最大似然估计(MLE)或者强化学习来训练这种模型。在实际应用中，我们还可以使用一些技巧来提高模型的性能，例如预训练、微调和集成等。