ollama实战(一) ：部署自己的模型（Safetensors格式）

被玩弄的小猫咪

已于 2024-10-01 18:24:07 修改

阅读量1.1w

点赞数 21

文章标签： llama

于 2024-10-01 18:23:25 首次发布

本文链接：https://blog.csdn.net/yierbubu1212/article/details/142673245

版权

ollama实战(一) ：部署自己的模型（Safetensors格式）

1.ollama下载操作

git clone https://www.modelscope.cn/modelscope/ollama-linux.git

cd ollama-linux
sudo chmod 777 ./ollama-modelscope-install.sh
./ollama-modelscope-install.sh

1.1说明

对于llama-chinese-8b进行ollama环境创建 Safetensors格式（这个格式推理比较慢）

对Safetensors weights支持的格式：

- Llama (including Llama 2, Llama 3, and Llama 3.1);
- Mistral (including Mistral 1, Mistral 2, and Mixtral);
- Gemma (including Gemma 1 and Gemma 2); and
- Phi3

注:8b创建环境内存所需空间大约要60g，不支持格式的模型须llamacpp转gguf格式

1.2模型下载

git clone https://www.modelscope.cn/FlagAlpha/Llama3-Chinese-8B-Instruct.git

2.ollama启动

ollama serve

3.创建file文件（非文件夹）

文件内容（即你的模型路径）

FROM ./Llama3-Chinese-8B-Instruct

4.ollama模型创建

file 及你创建的文件名

ollama create mymodel -f file

注:8b模型(safetensors)创建过程约会消耗60g内存

5.ollama运行

ollama run mymodel

注：大约占16个g显存，gguf格式约占6个g

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

被玩弄的小猫咪

关注关注

21
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

ollama教程——如何在Ollama中导入和管理GGUF与Safetensors模型

walkskyer的博客

07-09

7279

在使用Ollama之前，了解其支持的模型格式和版本要求是非常重要的。这部分将介绍Ollama支持的模型格式及其版本要求，并指导如何安装Ollama以确保您能够顺利进行模型导入。GGUF（General Graphical User Format）是一种高效的二进制文件格式，专门用于存储和读取机器学习模型的数据。它的设计目的是提供快速的加载和保存操作，同时保持模型数据的完整性和准确性。由于其高效性，GGUF格式被广泛应用于需要频繁读取和写入模型数据的场景中。

9.2 Ollama私有化部署实战：三步本地运行LLaMA 3，成本直降80%！

最新发布

yonggeit的博客

05-12

225

Ollama 是一个开源的大模型本地化部署工具，专为开发者提供私有化模型管理和生产级 API 服务。其核心功能包括模型仓库、推理引擎、API 网关和资源优化器，支持 50+ 开源模型的一键下载与版本管理，并通过动态显存分配和模型卸载技术，使得 8GB 显存即可运行 70B 参数模型。Ollama 与 LLaMA 家族模型和 LangChain 形成互补，提供统一的模型加载器和业务逻辑编排能力。通过命令行和 REST API，开发者可以快速启动模型并进行多轮对话或文本生成。企业级部署方案支持私有仓库、Kube

参与评论您还未登录，请先登录后发表或查看评论

ollama注册自定义模型（safetensors）

hbkybkzw的博客

03-16

1238

需要全程开启ollama需要注意，尽管手动下载的GGUF格式模型权重是阿里官方发布的模型权重，但仍然会偶尔出现和ollama不兼容，导致胡言乱语的情况出现。如果希望使用ollama进行推理，优先建议使用ollama pull命令下载ollama官方的GGUF格式。由于 Ollama 仅支持GGUF格式的模型，需将转换为.gguf格式以DeepSeek-R1-1.5B为例子。

本地已有embedding模型情况下model.safetensors如何导入ollama（以all-MiniLM-L12-v1为例）

2202_75368398的博客

03-26

513

kimi帮了很大忙，只做总结分享，有问题欢迎指正

【ollama3.1】ollama运行本地的模型文件.safetensors格式

JAVA之迷

07-25

2902

进入ollama的安装目录：D:\peft\ollama。新建立：lama31.txt文件。

使用ollama导入模型

wjj_fire的博客

02-10

4139

ollama可以轻松在本地部署大语言模型，简单方便，并且内置了丰富的大语言模型库，涵盖多种类型的模型，可以很方便的拉取模型。对于safetensors格式的模型，有些模型ollama无法导入（如 deepseek的模型），因此需要使用llama.cpp来进行格式的转换。从safetensors权重导入模型，首先需要创建一个Modelfile文件，其中包含一个指向包含你的 Safetensors 权重的目录的 FROM。在导入 GGUF 适配器时，重要的是使用与创建适配器时所用的相同基础模型。

Ollama本地部署自定义大模型

摇光65535的博客

10-07

3393

Ollama是一个专为本地机器设计的开源框架，旨在简化大型语言模型（LLM）的部署和运行过程。本文将使用Ollama来实现llama-3.1大模型的本地化部署。

safetensors -＞ ollama ，模型转化 + 模型量化详细步骤

arkohut的博客

06-30

1万+

这里记录了如何将 huggingface 上模型转化为 gguf 格式、模型量化并在 ollama 中使用。请结合视频一起食用。

ollama 使用自己的微调模型

spiderwower的博客

05-12

4万+

微调大模型的方法，这里不展开说，我使用的lora微调方法。微调大模型需要比较高的显存，推荐在云服务器上进行训练，系统环境为linux。

本地部署大模型？Ollama 部署和实战，看这篇就够了

u010522887的专栏

07-24

3万+

Ollama 也许是当前最便捷的大模型部署工具，配合Open WebUI，人人都可以拥有大模型自由。

ollama 部署自己微调过的模型

kjzd123的博客

06-06

6357

本指南将介绍如何在 Ollama 中导入 GGUF、PyTorch 或 Safetensors 模型。

本地部署大模型？Ollama 部署和实战，看这篇就够了！

xiangxueerfei的博客

03-07

3928

Ollama，它来了，专为在本地机器便捷部署和运行大模型而设计。也许是目前最便捷的大模型部署和运行工具，配合Open WebUI，人人都可以拥有大模型自由。今天，就带着大家实操一番，从 0 到 1 玩转 Ollama。

Ollama全面指南：安装、使用与高级定制

热门推荐

全世界的博客

05-30

14万+

Ollama是一个专为在本地环境中运行和定制大型语言模型而设计的工具。它提供了一个简单而高效的接口，用于创建、运行和管理这些模型，同时还提供了一个丰富的预构建模型库，可以轻松集成到各种应用程序中。Ollama的目标是使大型语言模型的部署和交互变得简单，无论是对于开发者还是对于终端用户。Ollama提供了一个直观且用户友好的平台，用于在本地环境中运行大型语言模型。启动Ollama服务：首先，确保Ollama服务已经安装并运行。在命令行中输入以启动服务。选择模型：使用命令查看可用的模型列表。

Ollama完整教程：本地LLM管理、WebUI对话、Python/Java客户端API应用

python122_的博客

08-06

1万+

老牛同学在前面有关大模型应用的文章中，多次使用了等），但对这个非常方便管理本地大模型的软件的介绍却很少。

Ollama：一个在本地部署、运行大型语言模型的工具

2401_85773359的博客

07-24

1185

Ollama是一个专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计的工具。所谓自定义模型就是不适用Ollama官方模型库中的模型，理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手，你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统，支持各类大模型。这里使用Docker快速进行部署。拉取镜像。

大模型框架汇总：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp

mama19971023的博客

07-29

969

vLLM是一个基于Python的LLM推理和服务框架，由伯克利大学LMSYS组织开源。它通过创新的PagedAttention技术、连续批处理、CUDA核心优化以及分布式推理支持，显著提高了LLM的推理性能。vLLM不仅简单易用，而且性能高效，广泛应用于各种NLP任务中。

图文教程仅需一条语句。部署运行deepseek。全精度safetensors模型。

gangbanrichuang的博客

03-13

665

图文教程仅需一条语句。部署运行deepseek。全精度safetensors模型。

Ollama常用信息

weixin_40090689的博客

04-28

1718

Ollama常用命令，常用模型，如何运行模型

ollama+open-webui，本地部署自己的大模型

spiderwower的博客

05-05

6万+

Open WebUI 是一种可扩展、功能丰富且用户友好的自托管 WebUI，旨在完全离线运行。它支持各种LLM运行器，包括 Ollama 和 OpenAI 兼容的 API。open-webui项目地址。

ollama: image: ollama/ollama:latest

05-13

ollama是一个基于Ubuntu 18.04的Docker镜像，其中包含了LAMP环境和phpMyAdmin。LAMP环境是指Linux、Apache、MySQL和PHP，是一种常用的Web服务器环境。phpMyAdmin是一个基于Web的MySQL数据库管理工具，可以通过浏览器轻松地管理MySQL数据库。如果您需要快速搭建一个Web服务器并进行数据库管理，ollama可以帮助您快速搭建环境，节省搭建时间和精力。