(LLaMa Factory)大模型训练方法--监督微调(Qwen2-0.5B)

1、准备训练数据SFT 的数据格式有多种,例如:Alpaca格式、OpenAI格式等。

#其中Alpaca格式如下:

[
  {
    "instruction":"human instruction (required)",
    "input":"human input (optional)",
    "output":"model response (required)",
    "system":"system prompt (optional)",
    "history":[
      [
"human instruction in the first round (optional)","model response in the first round (optional)"
      ],
      [
"human instruction in the second round (optional)","model response in the second round (optional)"
      ]
    ]
  }
]

根据以上的数据格式,我们在ModelScope的数据集找到中文医疗对话数据-Chinese-medical-dialogue符合上述格式。

# 使用git命令拉取数据集 至data目录下
git clone https://www.modelscope.cn/datasets/xiaofengalg/Chinese-medical-dialogue.git /mnt/workspace/LLaMA-Factory/data
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风起晨曦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值