单个消费级GPU笔记本win电脑测试LLaMA模型

最新推荐文章于 2024-07-08 05:00:00 发布

StringEast

最新推荐文章于 2024-07-08 05:00:00 发布

阅读量2.8k

点赞数

文章标签：人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/StringEast/article/details/129839639

版权

本文详述了如何在消费级GPU笔记本上安装和运行LLaMA模型，包括环境配置、模型下载、量化处理及运行选项。实验结果显示LLaMA在常识推理、闭卷问答等方面表现出色，与GPT-3等模型相比有优势。

摘要由CSDN通过智能技术生成

1、LLaMa模型代码：

GitHub - facebookresearch/llama: Inference code for LLaMA models

不同模型对参数规模要求不同，有7B、13B、30B(33B)和65B四个数据规模。

Model	MP
7B	1
13B	2
30B（33B)	4
65B	8

2、环境检查

（1）、检查CUDA环境是否已安装（没有的话先安装CUDA）：

（2）、检查是否已安装Pytorch（没有的话先安装Pytorch）：

3、LLaMa模型下载：

（1）、7B模型：

nyanko7/LLaMA-7B at main (huggingface.co)

（2）、13B模型：

最低0.47元/天解锁文章

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
单个消费级GPU笔记本win电脑测试LLaMA模型

b N，--batch_size N用于提示处理的批量大小（默认值：8）-n n，--n_predict n个要预测的令牌数（默认值：128）将在"7B”文件夹产生一个名为”models/7B/ggml-model-q4_0.bin"的文件。将在"7B”文件夹产生一个名为”models/7B/ggml-model-f16.bin"的文件。-t N，--N个线程[计算期间要使用的线程数（默认值：4）]--top_k N top-k采样（默认值：40）-s SEED，--种子（默认值：-1）
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。