ollama 部署自己微调过的模型

最新推荐文章于 2025-03-16 21:02:44 发布

kjzd123

最新推荐文章于 2025-03-16 21:02:44 发布

阅读量6.2k

点赞数 4

文章标签： chatgpt 人工智能 microsoft 神经网络

本文链接：https://blog.csdn.net/kjzd123/article/details/139507674

版权

使用 Ollama 导入模型

本指南将介绍如何在 Ollama 中导入 GGUF、PyTorch 或 Safetensors 模型。

导入 GGUF 模型

第一步：编写 Modelfile

首先创建一个 Modelfile。该文件是模型的蓝图，用于指定权重、参数、提示模板等。

示例 Modelfile：

FROM ./mistral-7b-v0.1.Q4_0.gguf
TEMPLATE "[INST] {
  { .Prompt }} [/INST]"

第二步：创建 Ollama 模型

使用 Modelfile 创建一个模型：

ollama create example -f Modelfile

第三步：运行你的模型

使用以下命令测试模型：

ollama run example "你最喜欢的调味品是什么？"

导入 PyTorch 和 Safetensors 模型

从 PyTorch 和 Safetensors 导入模型的过程比导入 GGUF 更长，改进工作正在进行中。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kjzd123

关注关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

ollama教程——如何在Ollama中导入和管理GGUF与Safetensors模型

walkskyer的博客

07-09

7101

在使用Ollama之前，了解其支持的模型格式和版本要求是非常重要的。这部分将介绍Ollama支持的模型格式及其版本要求，并指导如何安装Ollama以确保您能够顺利进行模型导入。GGUF（General Graphical User Format）是一种高效的二进制文件格式，专门用于存储和读取机器学习模型的数据。它的设计目的是提供快速的加载和保存操作，同时保持模型数据的完整性和准确性。由于其高效性，GGUF格式被广泛应用于需要频繁读取和写入模型数据的场景中。

部署AI平台-Ollama

大AI时代，人性化的信息更加难得可贵

07-06

1463

介绍 llama：LLaMA(Large Language Model Meta AI)是由 Meta(原Facebook公司)发布的一系列大型语言模型。这些模型旨在处理和生成自然语言文本，能够执行多种任务，如文本摘要、翻译、问答、文本生成等。LLaMA 模型因其高效的性能和较小的模型尺寸而受到关注，这使得它们能够在资源有限的环境中运行，例如个人计算机或移动设备。 Ollama：是一个开源的大...

2 条评论您还未登录，请先登录后发表或查看评论

safetensors -＞ ollama ，模型转化 + 模型量化详细步骤

arkohut的博客

06-30

1万+

这里记录了如何将 huggingface 上模型转化为 gguf 格式、模型量化并在 ollama 中使用。请结合视频一起食用。

ollama注册自定义模型（safetensors）

热门推荐

spiderwower的博客

05-12

4万+

微调大模型的方法，这里不展开说，我使用的lora微调方法。微调大模型需要比较高的显存，推荐在云服务器上进行训练，系统环境为linux。

基于ollama部署微调模型

XZH_iD的博客

06-24

1958

基于ollama部署微调模型。

Ollama创建微调模型

qq_51279133的博客

06-08

3569

converted.bin为上一步转换模型得到的文件，quantized.bin为量化后的文件，q4_0为量化选项表示使用 4bit 量化（官方推荐），当然还有很多的量化选项，具体参见。这里只需要将 Modelfile 中 FROM 后面的文件路径替换为模型文件的目录即可，my-llama3是自定义的在 ollama 中的模型名称。，具体用哪个脚本进行转换我没有找到官方文档说明，建议一个不行就试另一个，在我使用过的模型中llama3 8b和 qwen 7b都是需要使用。

Llama微调以及Ollama部署

Yoin.

09-29

1970

微调大模型要想获得比较好的效果，拥有高质量的数据集是关键。可以选择用网上开源的，或者是自己制作。以中文数据集弱智吧为例，约1500条对话数据，数据集可以从。基础大模型我选择Mistral-7B-v0.3-Chinese-Chat-uncensored，新建一个merge.py文件，将基础模型和lora模型合并为一个新的模型文件。至此，llama微调后的模型操作完毕，可以直接使用。打开Ollama，找到目录中现有的模型，使用。

使用ollama本地部署微调后的大语言模型

琴智冰

01-21

1537

在使用LlaMA-Factory导出的模型时，由于其输出格式与Ollama所需的格式不一致，需要借助llama.cpp的工具将模型转换为GGUF格式，以便在Ollama中使用。Ollama是一款开源的本地大语言模型推理工具，支持对LLM模型进行管理、训练和推理，并提供了WebUI界面和客户端API。

在ubuntu如何使用ollama部署自己微调模型的服务

qq603288332的博客

08-01

597

看了很多的博客，基本都是把官方文档例子，只是启动已有模型的方法。。。。。随后看了文档之后，成功点亮自己的服务！（乱码可以忽略。。。。

《AI大模型应用》--ollama本地部署通义千问.zip

07-15

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...

Ollama本地部署自定义大模型

摇光65535的博客

10-07

3325

Ollama是一个专为本地机器设计的开源框架，旨在简化大型语言模型（LLM）的部署和运行过程。本文将使用Ollama来实现llama-3.1大模型的本地化部署。

LLaMa大模型微调

rosemary1225的博客

05-30

3729

先下载一个完整版本的LLaMa模型，官网的或别人下载微调过的中文版本的。

使用Ollama配置本地微调的gguf模型文件

weixin_43217276的博客

07-30

3429

在之前的文章中，我们已经得到了经过我们微调的大语言模型，不管是在本地部署使用或者是用OpenWebUI界面部署在服务器上达到和chatGPT界面类似的效果，使用Ollama部署一定是最好的选择。以下均为在Ubuntu系统（Linux）上的测试。

ollama导入自己微调后的模型胡言乱语

m0_57057282的博客

05-21

3231

原因：Modelfile的模板格式不对，对的如下所示。1.ollama导入自己微调后的模型胡言乱语。下载llama.cpp。

通过ollama（modelfile）微调deepseek，制作自己的大模型

weixin_57843813的博客

02-09

9165

通过modelfile制作自己的大模型！

模型微调+上传ollama

weixin_40639005的博客

02-28

835

3，通过这玩意思，直接创建一个虚拟环境，主要目的是为了区分不同项目的依赖冲突等等，我在这里吃过亏，先是Python3.12版本搞半天，后面发现依赖有问题，于是又搞个3.10版本的，还是冲突，一气之下全删了，再安装3.10，又研究了虚拟环境，后面就顺了。4，通过DeepSeek，搞一套python训练模型的代码，最好描述清晰一点，对python不是很熟，研究了一下代码，大概看懂了，最主要的是少什么依赖，在虚拟环境下直接安装就行，它提供的代码最终能训练成模型。

模型微调+上传ollama+不放弃

weixin_40639005的博客

03-04

742

"记录显示，{字段1}的值为{值1}，{字段2}的值为{值2}，{字段3}的值为{值3}，{字段4}的值为{值4}，{字段5}的值为{值5}，{字段6}的值为{值6}。"供应商记录详情：{字段1}: {值1}，{字段2}: {值2}，{字段3}: {值3}，{字段4}: {值4}，{字段5}: {值5}，{字段6}: {值6}。"这是一条供应商记录，其中{字段1}为{值1}，{字段2}为{值2}，{字段3}为{值3}，{字段4}为{值4}，{字段5}为{值5}，{字段6}为{值6}。

AI大模型本地化微调+部署：使用ollama进行本地化微调+部署（附教程）

2301_81940605的博客

01-10

1616

LLaMA 模型因其高效的性能和较小的模型尺寸而受到关注，这使得它们能够在资源有限的环境中运行，例如个人计算机或移动设备。

ollama部署微调大模型

02-21

### Ollama平台部署和微调大型模型 #### 部署准备为了成功部署并使用Ollama平台上的大型模型，首先要确保能够访问Ollama的模型库，这一步骤对于下载和利用预构建的模型至关重要[^4]。 #### 基础命令概览在Ollama平台上操作模型主要依赖一系列基础命令。这些命令涵盖了从管理现有模型到执行特定任务的各种功能。例如，`ollama list`用于展示当前可用的模型列表；而要获取某个具体模型的信息，则可以通过`ollama show <模型名>`实现。当需要移除不再使用的模型时，可采用`ollama rm <模型名>`来完成这一操作[^1]。 #### GGUF格式模型部署流程针对GGUF格式的模型文件，在Ollama环境中部署涉及几个关键步骤。首先是导入模型至Ollama系统内，假设已有一个经过微调处理得到的GGUF模型文件位于指定路径下（如`/path/to/output.gguf`），那么接下来便是将其正式加入到Ollama的服务体系之中[^5]。 #### 微调过程中的注意事项考虑到性能优化以及资源的有效分配，在对大型语言模型实施微调之前应当充分评估硬件条件和支持能力。此外，编写专门的方法比如`askLocalEchartsModel`可以帮助更好地封装与定制化交互逻辑，其中涉及到向选定的微调版Echarts模型发送查询请求的过程[^3]。 ```python def askLocalEchartsModel(prompt): model_name = "micro_tuned_echarts_model" command = f"ollama run {model_name} '{prompt}'" result = subprocess.run(command, shell=True, capture_output=True, text=True) return result.stdout.strip() ```