一、下载visual studio
下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux
选择c++桌面开发
二、下载cmake
三、下载CUDA toolkits(需要GPU加速可选)
CUDA Toolkit - Free Tools and Training | NVIDIA Developer
四、安装 curl(需要联网下载模型可选)
git clone https://github.com/microsoft/vcpkg.git
cd vcpkg
.\bootstrap-vcpkg.bat
.\vcpkg install curl:x64-windows
需手动新建模型下载目录C:\Users\Administrator\AppData\Local\llama.cpp
五、下载llama.cpp源代码并编译:
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build -DGGML_CUDA=ON -DLLAMA_CURL=ON
cmake --build build --config Release
-B build:指定构建目录为 ./build。
-DGGML_CUDA=ON:启用 CUDA 支持(需已安装 CUDA 工具包)。
-DLLAMA_CURL=ON:启用 CURL 支持(需已安装 curl)
六、进入build\bin\Release目录开始使用llama