ollama直接pull下载模型太慢了
研究了一下可以通过
魔搭社区 下载gguf模型文件,本地再加载!!!
以后模型微调也可以这么操作,这个还是要学习的!!!!!
例如下载在D盘的gguf目录,可以在这个目录减一个导入txt文件
my-DeepSeek-R1-Distill-Qwen-7B.txt
将以下内容黏贴到txt文件里面,如下
FROM ./DeepSeek-R1-Distill-Qwen-7B-GGUF
PARAMETER temperature 0.7
PARAMETER top_p 0.95
PARAMETER top_k 40
PARAMETER repeat_penalty 1.1
PARAMETER min_p 0.05
PARAMETER num_ctx 1024
PARAMETER num_thread 4
PARAMETER num_gpu 8
# 设置对话终止符
PARAMETER stop "<|begin▁of▁sentence|>"
PARAMETER stop "<|end▁of▁sentence|>"
PARAMETER stop "<|User|>"
PARAMETER stop "<|Assistant|>"
SYSTEM """
"""
TEMPLATE """{{- if .System }}{{ .System }}{{ end }}
{{- range $i, $_ := .Messages }}
{{- $last := eq (len (slice $.Messages $i)) 1}}
{{- if eq .Role "user" }}<|User|>{{ .Content }}
{{- else if eq .Role "assistant" }}<|Assistant|>{{ .Content }}{{- if not $last }}<|end▁of▁sentence|>{{- end }}
{{- end }}
{{- if and $last (ne .Role "assistant") }}<|Assistant|>{{- end }}
{{- end }}"""
dos命令行如下输入命令
cd D:\gguf
ollama create my-DeepSeek-R1-Distill-Qwen-7B -f ./DeepSeek-R1-Distill-Qwen-7B-GGUF