fine-tune Microsoft/Phi-3-mini-128k-instruct

AIVoyager

已于 2024-05-28 18:23:28 修改

阅读量752

点赞数 10

分类专栏： transformers NLP 文章标签：人工智能深度学习 transformer phi-3

于 2024-05-28 18:22:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35215756/article/details/139271308

版权

目录

logging
超参数
模型和Tokenizer加载
数据处理
数据集加载与处理
训练
保存微调模型
参考

使用transformers在聊天指令数据集上使用LoRA对Phi-3语言模型进行微调，以改进会话理解和响应生成。

logging

日志记录:设置日志记录以跟踪训练过程。

import sys
import logging

import datasets
from datasets import load_dataset
from peft import LoraConfig
import torch
import transformers
from trl import SFTTrainer
from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, BitsAndBytesConfig

# Logging setup (you can customize this as needed)
logging.basicConfig(
    format="%(asctime)s - %(levelname)s - %(name)s - %(message)s",
    datefmt="%Y-%m-%d %H:%M:%S",
    handlers=[logging.StreamHandler(sys.stdout)],
)
logger = logging.getLogger(__name__)

超参数

超参数:定义两个字典，training_config和peft_config，分别存储用于训练和PEFT(Parameter-Efficient Fine-Tuning)的超参数。
训练参数:从training_config字典中创建一个TrainingArguments对象。
PEFT配置:从peft_config字典创建一个LoraConfig对象，指定LoRA (Low-Rank Adaptation)设置以进行有效的微调。

# Training hyperparameters
training_config = {
   
    "bf16": True,  # Use mixed precision
    "do_eval": False,
    "learning_rate": 5.0e-06,
    "log_level": "info",
    "logging_steps": 20,
    "logging_strategy": "steps",
    "lr_scheduler_type": "cosine",
    "num_train_epochs": 1,
    "max_steps": -1,
    "output_dir": "./checkpoint_dir",

最低0.47元/天解锁文章

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
fine-tune Microsoft/Phi-3-mini-128k-instruct

使用transformers在聊天指令数据集上使用LoRA对Phi-3语言模型进行微调，以改进会话理解和响应生成。
复制链接

扫一扫

专栏目录

AIVoyager CSDN认证博客专家 CSDN认证企业博客

码龄8年

33: 原创

43万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

744: 积分

341: 粉丝

410: 获赞

12: 评论

460: 收藏

私信

关注

热门文章

分类专栏

c++ 6篇
杂项 6篇
python 6篇
pytorch 7篇
NLP 5篇
transformers 7篇
AIGC 2篇
CV

最新评论

使用vscode调试c++、python、torchrun、deepspeed程序
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Transformers之环境安装
AIVoyager: transformers可以pip直接安装或者源码安装，可以尝试一下不同的方法。
Transformers之环境安装
2301_81343490: 你好，pip安装transformers这一步到numpy就显示报错Downloading numpy-1.26.4-cp311-cp311-win_amd64.whl (15.8 MB) - -------------------------------------- 0.7/15.8 MB 8.5 kB/s eta 0:29:27 ERROR: Exception: Traceback (most recent call last): File "D:\360Downloads\downloads\anaconda\envs\python-transformers\Lib\site-packages\pip\_vendor\urllib3\response.py", line 438, in _error_catcher yield
Flask+tornado+Nginx+pywin32实现本地网络部署
chcgvj45657: import win32event import win32service import win32serviceutil import winerror 这几个依赖在哪里下
igraph在linux环境中安装
CSDN-Ada助手: 恭喜您在博客中分享了关于igraph在linux环境中安装的内容，这对于许多读者来说都是非常有用的信息。希望您能继续坚持创作，为大家带来更多有趣、实用的文章。或许接下来可以考虑分享一些igraph在实际项目中的应用案例，让读者更加深入地了解这个工具的使用方法。期待您的下一篇博客！祝您创作愉快！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。