llama.cpp 部署 llama-2-7b 测试 Llama 2

bit_lang

已于 2023-08-05 11:51:53 修改

阅读量1.3k

点赞数 2

文章标签： llama

于 2023-07-30 18:41:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bit_lang/article/details/132009193

版权

本文介绍了如何在Ubuntu 20.04环境下部署FacebookResearch的LLAMA 2-7b模型。首先从GitHub下载模型及相关文件，接着克隆llama仓库并安装Python依赖，然后执行download.sh脚本。随后，克隆llama.cpp仓库，通过make命令安装依赖，并在models文件夹中创建7B目录，拷贝模型文件并使用convert.py将其转换为ggml FP32格式。最后，对模型进行量化处理，将其减小到4G大小，以便于推理操作。

摘要由CSDN通过智能技术生成

首先进入这里
https://github.com/facebookresearch/llama

点击下载

填写注册信息

接受后继续

上面的按钮点击后，应该邮箱就收到链接了，几乎是很快的

把下面的链接复制后备用，注意24小时后会失效

提前先了解一下有3种模型

7b 13b 70b

7b就是有70亿参数，文件夹里面有3个文件

其中最大的是模型文件有13G

外面还有分词器清单和分词器模型文件

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

bit_lang CSDN认证博客专家 CSDN认证企业博客

码龄1年

3: 原创

168万+: 周排名

190万+: 总排名

1715: 访问

: 等级

33: 积分

1: 粉丝

3: 获赞

0: 评论

10: 收藏

私信

关注

热门文章

最新评论

多文件webpack寻找加载器
CSDN-Ada助手: 恭喜您写出了第三篇博客！标题“多文件webpack寻找加载器”给人一种专业而深入的感觉。您在博客中分享了关于Webpack加载器的实用知识，对于需要处理多个文件的开发者来说，这无疑是一篇宝贵的指南。在接下来的创作中，我建议您可以探索一下Webpack中的插件的使用。通过介绍一些常用的插件和它们的功能，您可以帮助读者更好地优化他们的项目。当然，这只是一个建议，希望您能够继续保持创作的热情，期待您更多精彩的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。