How to Fine-Tune an LLM from Hugging Face? 笔记

最新推荐文章于 2025-04-27 17:05:42 发布

Hungry_Flo

最新推荐文章于 2025-04-27 17:05:42 发布

阅读量1.1k

点赞数 27

文章标签：笔记深度学习人工智能

本文链接：https://blog.csdn.net/weixin_73545092/article/details/136906032

版权

How to Fine-Tune an LLM from Hugging Face? 笔记

使大模型适应特定领域的方法：fine-tuning微调、prompt engineering提示词工程、RAG检索增强生成。

大语言模型的微调

微调可以是全部微调，也可以是部分微调，由于大语言模型过于巨大，全部微调是不现实的，因此 Performance Efficient fine-tuning(PEFT) 是一种微调大语言模型的常用方法。

载入预训练的模型

Hugging Face 有很多有用的库和模块，例如 SFT, PEFT 和 AutoTokenizer。

在这里我们使用 Falcon-7b

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
from peft import LoraConfig

modelID = "tiiuae/falcon-7b"

LORA 是一种低资源微调大模型的方法。

准备数据集

SFT 可以直接使用 Hugging Face 中的数据集，当然也可以自己上传。

dataset = load_dataset("timdettmers/openassistant-guanaco", split="train")

根据需求来调整模型

除了可以使用部分微调的方法，我们还可以使用 quantization （神经网络量化）来减少参数量。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hungry_Flo

关注关注

27
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用 Python 从头开始构建百万参数 LLM

AI天才研究院

12-22

380

使用 Python 从头开始构建百万参数 LLM: A Step-by-Step Guide to Replicating LLaMA Architecture 复制 LLaMA 架构的分步指南

人工智能_大模型077_AI产品部署和交付07_大模型开发架构设计_本地运行chatglm3_基于VLLM安装以及部署开源大模型_在VLLM中部署YI-6B-Chat---人工智能工作笔记0212

添柴程序猿的专栏

05-24

237

1 条评论您还未登录，请先登录后发表或查看评论

如何从huggingface官网下载模型

热门推荐

薰珞婷紫小亭子的博客

10-10

7万+

如何从huggingface官网下载模型操作步骤：首先打开huggingface官网：https://huggingface.co/ 进入官网之后，点击“Models",如下图：如果想要下载数据集，则同样的操作方法，点击”Datasets“. 进入”Models“,之后，在搜索框，输入想要download的模型名称。本文示例是：bert-base-cased 找到想要下载的模型，点击进入，出现下面的画面：点击”Files and versions“,找到自己想要下载的文件即可。本文的示例可

下载huggingface上模型的正确姿势

ljp1919的专栏

07-25

6万+

如何优雅地下载huggingface上模型文件？

Hugging face 模型微调系列2—— 实战transfomers实体识别finetun

张伟的专栏

09-26

1483

上一篇文章中（Hugging face 模型微调系列1—— 实战transfomers文本分类finetune），我们学会如何利用hugging face中的预训练模型训练一个文本分类的任务，接下来我们尝试利用hugging face的AutoModelForTokenClassification的api完成一个实体识别的任务。其中 transfomers 包的安装和hugging face的下载这一步，笔者在Hugging face 模型微调系列1—— 实战transfomers文本分类finetune。

深度网络 Fine-tuning方法简介

lsn_sgj的博客

01-11

1296

转自：http://blog.csdn.net/wendox/article/details/52840372 迁移学习有两种方式,一是卷积网络作为固定的特征提取器.拿到一个预训练好的卷积网络,去掉全连接层,吧其余的部分作为一个特征提取器.alex网络会计算一个4096D的特征向量,称之为cnn codes.有了这些特征很容易训练一个线性分类器. 另外一种方式是fine-tuni

如何fine tuning

xys430381_1的专栏

09-18

1561

为什么要fine－tuning？### 我们有自己的图像识别任务，然而我们的数据集太小，直接进行训练很容易出现过拟合现象所以比较好的解决方案是先在一个大数据集中训练以提取比较准确的浅层特征，然后再针对这个训练过的网络利用我们的数据集进行训练，那么效果就会好很多。这个过程就是fine－tuning。 model zoo### 大家都注意到了这个情况，所以（1）FeifeiLi带头创建imagen...

LLM模型finetune_量化_部署

xiaomu_347的博客

05-30

1083

- LoRA方法应该是目前针对大语言模型中微调效果最好的一种方法，该方法的示意图如下，具体来说就是固定原始模型权重，然后定义两个低秩矩阵作为新增weight参与运算，并将两条链路的结果求和后作为本层的输出，而在微调时，只梯度下降新增的两个低秩矩阵。其中，大模型微调技术在此过程中起到了非常关键的作用，它提升了模型的生成效率和适应性，使其能够在多样化的应用场景中发挥更大的价值。通过对LLM的Embedding层进行改造，在微调时固定其他层的weight，，它在官方LoRA源码的基础上做了详细的代码注释。

【LLM-RAG】知识库问答 | 检索 | embedding

发现问题，并解决问题，批判性思维

01-01

5405

RAG流程（写作论文中的background：公式设定、emb、召回内容、召回基准）（工作中的思路《A Survey on Retrieval-Augmented Text Generation》该工作旨在对检索增强文本生成进行研究。主要核心的点如下：1、Retrieval Source知识来源源训练语料：有标注的训练数据直接作为外部知识；外部数据：支持提供训练数据之外的外部知识作为检索来源，比如于任务相关的领域数据，实现模型的快速适应；无监督数据：前两种知识源都需要一定的人工标注来完善“检索依据-

Llama - 微调

AI工程化、开源分享、文档翻译、代码笔记

07-16

1515

微调实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PEFT LoRA QLoRA微调

Huggingface trainer、model.from_pretrained、tokenizer()简单介绍（笔记）

鲨鱼儿的博客

03-31

1万+

总的来说,这个函数负责完成训练前的所有准备工作,包括加载检查点、设置超参数搜索、配置训练环境等,最终调用内部训练循环执行实际的训练过程。它提供了一些可配置选项,如从检查点恢复训练、超参数搜索和忽略评估时的某些键等,以满足不同的训练需求。类的主要训练入口点。它负责设置训练环境、加载模型检查点、配置超参数搜索、寻找可执行的批次大小,并最终执行内部训练循环。函数是 Hugging Face Transformers 库中。

苹果大模型系列之使用 MLX 在 macOS 上通过 LLM 微调构建自己的 LLM，在 Mac M2 上，训练过程大约需要 36 分钟（教程含详细步骤与代码）

iCloudEnd的博客

06-28

1407

在我之前的系列文章LlamaIndex中，我讨论了使用、LangChain等工具构建 RAG 应用程序，GPT4All, Ollama以利用 LLM 满足特定用例。在这篇文章中，我将探讨另一种称为 LLM 微调的方法。我使用名为的工具在 macOS 上对 Meta 的 LLaMA-3 和 Mistral LLM 进行了微调MLX，该工具是专为 Apple 芯片上的机器学习研究量身定制的数组框架。这种微调是使用一种名为的技术完成的Low Rank Adapters(LoRA)。

大语言模型在金融风控中的应用

AI天才研究院

03-09

1235

金融风控是金融机构确保其资产安全和业务稳定的重要手段。随着金融市场的复杂性和交易量的增加，传统的风控方法已难以应对日益增长的风险。近年来，随着大数据和人工智能技术的快速发展，金融风控领域逐渐引入了新的技术手段，其中大语言模型的应用尤为引人注目。大语言模型（Large Language Models, LLMs）通过在大规模文本数据上进行预训练，具备了强大的语言理解和生成能力。这些模型不仅能够处理结构化数据，还能从非结构化文本中提取有价值的信息，从而为金融风控提供了新的解决方案。

Python学习笔记（三）（程序流程控制）

wsys_yysn的博客

04-24

940

条件语句：通过实现分支逻辑。循环语句for遍历序列，while满足条件时循环。流程控制break终止循环，continue跳过当前迭代，pass占位。异常处理保证程序健壮性。掌握这些流程控制工具，可以编写更灵活、高效的 Python 程序！

【Python 学习笔记】 pip指令使用

老衲的少女心i~

04-23

288

当前文章记录的是我在学习过程的一些笔记和思考，可能存在有误解的地方，仅供大家参考，欢迎大家有问题指出~提示：以下是本篇文章正文内容，下面案例可供参考pip是一个现代的，通用的Python包管理工具。提供了对Python 包的查找、下载、安装、卸载功能，便于我们对Python的资源包进行管理。

C++笔记-模板进阶和继承(上)

最新发布

2301_80236968的博客

04-27

484

先讲第一条：关于父类的private成员，不管你是什么继承方式都是子类和类外无法访问的，这就像每个人都有自己的隐私，你的父母也有自己的隐私，隐私当然是不能被其他人看的。第三条的意思是取继承方式和父类成员权限的较小值，这里权限只是一种说法，后面就是权限的大小关系，取其中的较小值后父类的成员或者函数就变成子类中的相应权限的成员和函数。在上面的例子中，父类和子类中都有num1成员变量，但我们通过结果可知，输出的并不是父类中的num1，而是子类中的num1，此时就是子类把父类的同名成员给隐藏了。

BiliNote：开源的AI视频笔记生成工具，让知识提取与分享更高效——跨平台自动生成结构化笔记，实现从视频到Markdown的智能转化

这里汇聚了前沿的技术分享与实用的开发技巧，带你探索从创意到企业的技术创业之路。

04-25

290

BiliNote通过开源技术与智能算法的结合，让视频内容的价值释放变得触手可及。无论是学生、研究者还是内容创作者，都能借助这一工具高效地将动态视频转化为结构化知识。随着开源生态的扩展，我们期待看到更多创新功能的涌现，真正实现“让知识流动更自由”。，将视频内容转化为结构清晰的Markdown笔记，支持截图插入、原片跳转链接，并兼容本地语音转写模型与多种大语言模型（LLM），为学习者与创作者提供了。随着知识视频化趋势的加速，B站、YouTube等平台成为学习与信息获取的重要渠道，但。

gem5 笔记01 gem5 基本应用流程

eloudy的专栏

04-23

383

这里复制一份完整的代码，方便阅读requires(# booted.yield True},

黑马Java基础笔记-3

IKUNIKUNIKUNikun的博客

04-23

616

sout(arr)*打印出来是就是这个数组存在堆内存的地址值。776ec8df : 才是数组真正的地址值，（十六进制）D : 表示当前数组里面的元素都是double类型的。通过数组的索引可以获取到这个数组索引位置的具体值。平时我们习惯性的会把这个整体叫做数组的地址值。字符类型：默认初始化值’/u0000’空格。引用数据类型：默认初始化值null。布尔类型：默认初始化值false。扩展：解释一下地址值的格式含义。小数类型：默认初始化值0.0。普通的变量存储的真是的数据。整数类型：默认初始化值0。

How to Fine-Tune BERT for Text Classification?

05-19

Fine-tuning BERT for text classification involves the following steps: 1. Prepare your dataset: You need to prepare your dataset in a format that BERT can understand. For text classification, the input format consists of a pair of text sequences - the input text and the corresponding label. 2. Preprocess your dataset: You need to preprocess your dataset by tokenizing the text, adding special tokens ([CLS] and [SEP]), and converting the tokens to their corresponding IDs. 3. Load the pre-trained BERT model: You can use the pre-trained BERT model provided by Google or any other pre-trained BERT model and load it into memory. 4. Fine-tune the BERT model: You can fine-tune the BERT model by training it on your dataset. During training, you can adjust the hyperparameters such as the learning rate, batch size, and number of epochs. 5. Evaluate the model: After training, you can evaluate the model on a separate validation set to see how well it performs. You can use metrics such as accuracy, precision, recall, and F1 score to evaluate the model. 6. Test the model: Once you are satisfied with the performance of the model, you can use it to make predictions on new, unseen data. Overall, fine-tuning BERT for text classification is a powerful technique that can achieve state-of-the-art results on a wide range of NLP tasks.