模型转化 + 模型量化(从 safetensors 到 ollama)
下载和安装 ollama
wget https://github.com/ollama/ollama/releases/download/v0.1.47/ollama-linux-amd64
install ollama-linux-amd64 /usr/local/bin/ollama
ollama -v
启动 ollama
OLLAMA_MODELS=/root/autodl-tmp ollama serve
这里修改了 OLLAMA_MODELS
为 /root/autodl-tmp
,这样 ollama 会从这个目录下加载模型。
下载 llama3:8b 模型,查看 modelfile
ollama pull llama3:8b
可以通过命令查看这个模型的 modelf