llama.cpp

有梦想的鱼

已于 2024-07-01 01:11:19 修改

阅读量517

点赞数 5

文章标签： llama

于 2024-06-29 16:57:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38148600/article/details/140061876

版权

https://github.com/echonoshy/cgft-llm

cgft-llm/llama-cpp/README.md at master · echonoshy/cgft-llm (github.com)

【大模型量化】- Llama.cpp轻量化模型部署及量化_哔哩哔哩_bilibili

Release模式是直接运行，Debug模式是调试模型。

github.com/ggerganov/llama.cpp

export HF_ENDPOINT=https://hf-mirror.com

huggingface-cli download shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

cmake -B build_cpu
cmake --build build_cpu --config Release

cmake -B build_cuda -DLLAMA_CUDA=ON
cmake --build build_cuda --config Release -j 12

cd ~/code/llama.cpp/build_cuda/bin
./quantize --allow-requantize /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q8_0-v2_1.gguf /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q4_1-v1.gguf Q4_1

python convert-hf-to-gguf.py /root/autodl-tmp/models/Llama3-8B-Chinese-Chat --outfile /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q8_0-v1.gguf --outtype q8_0

有梦想的鱼

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
llama.cpp

https://github.com/echonoshy/cgft-llm【大模型量化】- Llama.cpp轻量化模型部署及量化_哔哩哔哩_bilibiligithub.com/ggerganov/llama.cppcd ~/code/llama.cpp/build_cuda/bin./quantize --allow-requantize /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q8_0-v2
复制链接

扫一扫

有梦想的鱼 CSDN认证博客专家 CSDN认证企业博客

码龄7年

79: 原创

8231: 周排名

2万+: 总排名

15万+: 访问

: 等级

1057: 积分

1484: 粉丝

132: 获赞

72: 评论

337: 收藏

私信

关注

热门文章

分类专栏

论文阅读 2篇
论文 5篇
基本神经网络 5篇
transform 3篇
pytorch 27篇
工作记录 3篇
gpu 6篇
install 2篇
nlp面试 1篇
机器学习 3篇
word2vec
tensorflow 5篇
cuda 1篇
cmd 1篇
系统实现需求分析 1篇
大学编程 4篇

最新评论

安装和微调大模型（基于LLaMA-Factory）
有梦想的鱼: https://blog.csdn.net/2201_75499442/article/details/139909899?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171983812316800180632826%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=171983812316800180632826&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-139909899-null-null.142^v100^pc_search_result_base3&utm_term=llama-factory%E4%BD%BF%E7%94%A8api%E6%8E%A5%E5%8F%A3%E8%B0%83%E7%94%A8&spm=1018.2226.3001.4187
安装和微调大模型（基于LLaMA-Factory）
有梦想的鱼: https://github.com/hiyouga/LLaMA-Factory/tree/main
安装和微调大模型（基于LLaMA-Factory）
有梦想的鱼: https://github.com/echonoshy/cgft-llm/blob/master/llama-factory/README.md
llama.cpp
有梦想的鱼: python -m vllm.entrypoints.openai.api_server --model
Ubuntu /liunx更改文件夹权限
有梦想的鱼: sudo chmod -R 777 /home/ldx/CQ

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。