LLaMA-Factory 项目推荐
1. 项目基础介绍和主要编程语言
LLaMA-Factory 是一个高效的大型语言模型(LLM)微调平台,旨在通过简单的 WebUI 界面,实现对 100 多种 LLM 的快速微调。该项目的主要编程语言是 Python,利用了 PyTorch 等深度学习框架来实现模型的训练和微调。
2. 项目的核心功能
LLaMA-Factory 提供了以下核心功能:
- 多模型支持:支持多种大型语言模型,如 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Qwen2-VL、Yi、Gemma、Baichuan、ChatGLM、Phi 等。
- 集成微调方法:包括连续预训练、多模态监督微调、奖励建模、PPO、DPO、KTO、ORPO 等。
- 资源扩展:支持 16 位全调、冻结调优、LoRA 和 2/3/4/5/6/8 位 QLoRA 等。
- 高级算法:如 GaLore、BAdam、Adam-mini、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA 和 Agent 调优等。
- 实用技巧:如 FlashAttention-2、Unsloth、Liger Kernel、RoPE 缩放、NEFTune 和 rsLoRA 等。
- 实验监控:支持 LlamaBoard、TensorBoard、Wandb、MLflow 等。
- 快速推理:提供 OpenAI 风格的 API、Gradio UI 和 CLI,支持 vLLM worker。
3. 项目最近更新的功能
LLaMA-Factory 最近更新的功能包括:
- 24/08/30:支持微调 Qwen2-VL 模型。
- 24/08/27:支持 Liger Kernel,通过设置
enable_liger_kernel: true
进行高效训练。 - 24/08/09:支持 Adam-mini 优化器,参考示例使用。
- 24/07/04:支持无污染的打包训练,通过设置
neat_packing: true
激活。 - 24/06/16:支持 PiSSA 算法,参考示例使用。
- 24/06/07:支持微调 Qwen2 和 GLM-4 模型。
- 24/05/26:支持 SimPO 算法进行偏好学习,参考示例使用。
- 24/05/20:支持微调 PaliGemma 系列模型,需使用
paligemma
模板进行聊天完成。 - 24/05/18:支持 KTO 算法进行偏好学习,参考示例使用。
- 24/05/14:支持在 Ascend NPU 设备上进行训练和推理,查看安装部分了解详情。
这些更新进一步增强了 LLaMA-Factory 的功能和灵活性,使其成为一个更加强大和全面的 LLM 微调工具。