llama2本地CPU推理运行

这篇教程详细介绍了如何在CPU上使用C语言进行llama2模型的推理。内容包括环境配置、模型转换为二进制格式以及C代码的编译和运行。通过运行提供的C代码,可以在Ubuntu系统上执行llama2的推理任务。
摘要由CSDN通过智能技术生成

介绍

本教程使用C语言部署运行llama2模型,可以高效地在CPU上进行推理。主要包含的内容有:
1 运行环境配置,包括C、python
2 原始llama2模型转换为二进制格式
3 使用C语言推理llama2

环境安装与配置

项目下载:
git clone https://github.com/karpathy/llama2.c.git
操作系统:ubuntu (Windows下我尝试过,编译会报错)
软件环境:
gcc make (已经有的就不用安装了)
python (我使用了3.9,其他版本预计都是可以的)
gcc安装:apt install build-essential
make安装:apt-get install make
python安装好之后安装一下依赖包,pip install -r requirements.txt

python主要作用就是将原始llama2模型转换为.bin二进制格式

github项目介绍

使用此仓库中的代码,您可以在PyTorch中从头开始训练Llama 2 LLM架构,然后将权重导出到二进制文件,并将其加载

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

会写代码的孙悟空

赠人玫瑰 手有余香

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值