1、数据集定义 针对实际的微调需求,使用专门针对业务垂直领域的私有数据进行大模型微调才是我们需要做的。因此,我们需要探讨如何在LLaMA-Factory项目及上述创建的微调流程中引入自定义数据集进行微调。**对于LLaMA-Factory项目,目前仅支持两种格式的数据集:alpaca 和 sharegpt。 1.1 alpaca alpaca 格式的数据集按照以下方式组织: [ { "instruction": "用户指令(必填)", "input":