MedicalGPT 模型训练教程

MedicalGPT 模型训练教程

MedicalGPTMedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。项目地址:https://gitcode.com/gh_mirrors/me/MedicalGPT

本教程将指导您了解和使用开源项目 MedicalGPT,这是一个用于训练医疗领域大模型的工具,实现了包括增量预训练(PT)、有监督微调(SFT)等多种训练流程。

1. 项目目录结构及介绍

项目的主要目录结构如下:

.
├── config           # 配置文件夹
│   ├── pt_config.json     # 增量预训练配置
│   └── sft_config.json    # 有监督微调配置
├── data              # 数据集存放位置
├── scripts           # 脚本文件夹
│   ├── pretrain.py       # 增量预训练脚本
│   └── fine_tune.py      # 有监督微调脚本
├── models             # 存放模型权重的文件夹
└── logs               # 日志文件夹
  • config: 包含不同训练阶段的配置文件。
  • data: 存储原始数据或预处理后的数据的地方。
  • scripts: 含有执行不同训练任务的Python脚本。
  • models: 在训练过程中保存的模型权重会被存储在这里。
  • logs: 存储日志文件,记录训练过程中的信息。

2. 项目的启动文件介绍

2.1 pretrain.py

该脚本用于执行增量预训练(PT)。它会读取config/pt_config.json配置文件中的参数,如模型大小、学习率等,并基于提供的预训练数据进行模型训练。

2.2 fine_tune.py

此脚本用于有监督微调(SFT)。它会读取config/sft_config.json配置文件,使用已有的预训练模型对特定的医疗任务数据集进行进一步的微调优化。

要运行这些脚本,确保在终端中切换到项目根目录并安装所有依赖,然后通过以下命令启动训练:

  • 对于增量预训练:
python scripts/pretrain.py --config config/pt_config.json
  • 对于有监督微调:
python scripts/fine_tune.py --config config/sft_config.json

3. 项目的配置文件介绍

config 文件夹中包含了两个主要的配置文件,它们以JSON格式定义了训练过程的关键参数:

3.1 pt_config.json

该文件设置增量预训练的参数,比如:

  • model_name: 模型名称。
  • model_size: 模型的规模(例如,'small', 'medium', 'large')。
  • data_dir: 预训练数据的路径。
  • batch_size: 训练批次大小。
  • learning_rate: 学习率。
  • warmup_steps: 学习率预热步数。

3.2 sft_config.json

这个文件配置有监督微调任务的参数,可能包括:

  • checkpoint_path: 微调前模型的检查点路径。
  • train_data_path: 训练数据集路径。
  • val_data_path: 验证数据集路径。
  • num_train_epochs: 微调轮数。
  • per_device_train_batch_size: 每个GPU上的训练批次大小。
  • per_device_eval_batch_size: 每个GPU上的评估批次大小。

根据实际需求调整这两个配置文件的参数,可以定制你的训练流程。在更改配置后,重新运行相应的训练脚本即可。

完成这些步骤后,您应该能够成功地利用MedicalGPT框架训练自己的医疗领域大模型。如有任何问题或需要更多帮助,欢迎查阅项目文档或直接在GitHub上提交问题。祝您好运!

MedicalGPTMedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。项目地址:https://gitcode.com/gh_mirrors/me/MedicalGPT

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

缪玺彬

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值