llama.cpp
文章平均质量分 79
曦紫沐
抟扶摇而上者九万里
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MacOS 上使用 Metal GPU 加速编译 llama.cpp 完整指南
本文详细介绍了在MacOS系统上使用Metal GPU加速编译llama.cpp的完整流程。原创 2026-05-18 17:17:31 · 597 阅读 · 0 评论 -
WSL 极速部署 llama.cpp:三步搞定 CPU、GPU 本地运行大模型(CUDA 加速)
本文详细介绍了在 WSL2 环境下安装 llama.cpp 并运行本地大模型的完整流程。从基础环境配置(包括 WSL2、CUDA 工具包和 Anaconda 安装),到源码编译(支持 CPU 和 NVIDIA GPU 加速),再到模型下载(提供 Hugging Face 和 modelscope 两种方式)。最后通过示例命令展示了模型推理和 API 服务启动方法,并附带了 GPU 监控和 CUDA 版本检查技巧,帮助用户快速实现本地 LLM 部署。原创 2026-04-19 15:48:49 · 2227 阅读 · 0 评论
分享