LLaMA-Factory 项目推荐

LLaMA-Factory 项目推荐

LLaMA-Factory 易于使用的LLM微调框架(LLaMA, BLOOM, Mistral, 百川, Qwen, ChatGLM)。 LLaMA-Factory 项目地址: https://gitcode.com/gh_mirrors/ll/LLaMA-Factory

1. 项目基础介绍和主要编程语言

LLaMA-Factory 是一个高效的大型语言模型(LLM)微调平台,旨在通过简单的 WebUI 界面,实现对 100 多种 LLM 的快速微调。该项目的主要编程语言是 Python,利用了 PyTorch 等深度学习框架来实现模型的训练和微调。

2. 项目的核心功能

LLaMA-Factory 提供了以下核心功能:

  • 多模型支持:支持多种大型语言模型,如 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Qwen2-VL、Yi、Gemma、Baichuan、ChatGLM、Phi 等。
  • 集成微调方法:包括连续预训练、多模态监督微调、奖励建模、PPO、DPO、KTO、ORPO 等。
  • 资源扩展:支持 16 位全调、冻结调优、LoRA 和 2/3/4/5/6/8 位 QLoRA 等。
  • 高级算法:如 GaLore、BAdam、Adam-mini、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA 和 Agent 调优等。
  • 实用技巧:如 FlashAttention-2、Unsloth、Liger Kernel、RoPE 缩放、NEFTune 和 rsLoRA 等。
  • 实验监控:支持 LlamaBoard、TensorBoard、Wandb、MLflow 等。
  • 快速推理:提供 OpenAI 风格的 API、Gradio UI 和 CLI,支持 vLLM worker。

3. 项目最近更新的功能

LLaMA-Factory 最近更新的功能包括:

  • 24/08/30:支持微调 Qwen2-VL 模型。
  • 24/08/27:支持 Liger Kernel,通过设置 enable_liger_kernel: true 进行高效训练。
  • 24/08/09:支持 Adam-mini 优化器,参考示例使用。
  • 24/07/04:支持无污染的打包训练,通过设置 neat_packing: true 激活。
  • 24/06/16:支持 PiSSA 算法,参考示例使用。
  • 24/06/07:支持微调 Qwen2 和 GLM-4 模型。
  • 24/05/26:支持 SimPO 算法进行偏好学习,参考示例使用。
  • 24/05/20:支持微调 PaliGemma 系列模型,需使用 paligemma 模板进行聊天完成。
  • 24/05/18:支持 KTO 算法进行偏好学习,参考示例使用。
  • 24/05/14:支持在 Ascend NPU 设备上进行训练和推理,查看安装部分了解详情。

这些更新进一步增强了 LLaMA-Factory 的功能和灵活性,使其成为一个更加强大和全面的 LLM 微调工具。

LLaMA-Factory 易于使用的LLM微调框架(LLaMA, BLOOM, Mistral, 百川, Qwen, ChatGLM)。 LLaMA-Factory 项目地址: https://gitcode.com/gh_mirrors/ll/LLaMA-Factory

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

薄梦熙Lorraine

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值