第二十七篇-Ollama-加载本地模型文件

如何你本地下载好GGUF文件,可以推送到ollama中使用,节省从ollama官网拉取时间

1.准备gguf文件

下载 
/models/Qwen1.5-32B-Chat-GGUF/qwen1_5-32b-chat-q4_k_m.gguf

查看已有Modelfile文件

查看所有模型

ollama list

内容

NAME                            ID              SIZE    MODIFIED    
gemma:2b                        b50d6c999e59    1.7 GB  2 days ago 
internlm2:latest                46cde8aad8ff    4.7 GB  3 days ago 
llama-3-8b:latest               54e4e24b2bec    4.9 GB  2 days ago 
mistral-7b:latest               fe7ebabb08f5    4.1 GB  2 days ago 
mixtral-7_8b:latest             7b96df9a349a    26 GB   2 days ago 
qweb-14b:latest                 6137264107d3    9.4 GB  2 days ago 
qwen:0.5b-chat-v1.5-q4_K_M      e1c9c6192a7e    407 MB  2 days ago 
qwen1.5-14b:latest              3cc8bb79440c    9.2 GB  2 days ago 
qwen1.5-32b:latest              96743882fd6d    19 GB   5 hours ago
qwen1.5-72b-q2:latest           ac5b2e824d5c    28 GB   5 hours ago
qwen1.5-moe:latest              b3247e5069ed    10 GB   2 days ago 

可以查看已有下载的modlefile文件内容

ollama show qwen:0.5b-chat-v1.5-q4_K_M --modelfile

内容如下

FROM /root/.ollama/models/blobs/sha256-74c6b67ef34725145d42cae57543e2b6865dfedef1ff1dc6d6f53e1f691383ec
TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>{{ end }}<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""
PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"    

准备本地Modelfile文件

vim qwen1.5-32b.mf

内容如下

FROM /models/Qwen1.5-32B-Chat-GGUF/qwen1_5-32b-chat-q4_k_m.gguf

TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>{{ end }}<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""
PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"

文件名可以自定义

执行加载

ollama create qwen1.5-32b -f qwen1.5-32b.mf

等等一段时间会提示完成

验证

ollama list

qwen1.5-32b:latest              96743882fd6d    19 GB   5 hours ago

启动

ollam run qwen1.5-32b:latest

或查看运行指标
ollama run qwen1.5-32b:latest --verbose

第二十四篇-Ollama-在线安装
第二十五篇-Ollama-离线安装
第二十六篇-Ollama-监听本地IP与端口
第二十七篇-Ollama-加载本地模型文件
第二十八篇-Ollama-TeslaP40-Ollama-8B-Qwen1.5-32B等速度
第三十篇-Ollama-TeslaP40-Ollama-Qwen2-57B等速度

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值