windows 下跑起大模型（llama）操作笔记

最新推荐文章于 2024-08-06 17:42:23 发布

TesterHome官方

最新推荐文章于 2024-08-06 17:42:23 发布

阅读量1.5k

点赞数 18

文章标签：笔记人工智能自动化测试测试工具

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Testerhomee/article/details/136129501

版权

本文介绍了如何在Windows10系统上，利用预编译的LLama.cpp和CUDA12.3，轻松配置环境并实现GPU加速的ChatGPT模型运行，以及如何下载量化模型和创建prompt文件。作者还提到了在受限网络环境下使用Huggingface镜像站下载模型的方法。

摘要由CSDN通过智能技术生成

原贴地址：https://testerhome.com/topics/39091

前言

国内访问 chatgpt 太麻烦了，还是本地自己搭一个比较快，也方便后续修改微调啥的。

之前 llama 刚出来的时候在 mac 上试了下，也在 windows 上用 conda 折腾过，环境配置步骤太多，都没跑起来。最近网上看到有预编译的，对环境要求降低了非常多，所以早上试了下，终于跑起来了。

使用平台

系统：windows 10

硬件：i5 12400F + 32GB 内存 + RTX 3090 显卡

具体步骤

主要参考 llama.cpp教程：Windows系统上无需编译，直接运行一个自己的LLaMA 2 - 怕刺。基本上使用的都是已经预编译好的软件，不用特别折腾环境配置。

因为用了 nvidia 的显卡，而且 cpu 本身也不强，所以主要配置为 gpu 加速为主

下载 cuda

直接到

最低0.47元/天解锁文章

TesterHome官方

关注

18
点赞
踩
25

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。