Llama-factory微调
模型的微调、推理和合并
微调
llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml
推理
llamafactory-cli chat examples/inference/llama3_lora_sft.yaml
合并
llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml
合并后的模型格式为.safetensors,使用llama.cpp转换成gguf格式
进入llama.cpp中
python convert-hf-to-gguf.py [需要转换的模型文件夹位置]
得到gguf格式后导入ollama
1、编码Modelfile文件
1.1 创建一个文本文件,并改名为模型名,扩展名为Modelfile。例如,llama3-8b.modelfile
1.2 用记事本编辑器打开文件,并添加内容
FROM [你自己的模型地址