LlamaGPT -基于Llama 2的自托管类chatgpt聊天机器人

最新推荐文章于 2024-08-31 20:00:26 发布

新缸中之脑

最新推荐文章于 2024-08-31 20:00:26 发布

阅读量2.2k

点赞数

文章标签： llama chatgpt 机器人

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shebao3333/article/details/132384070

版权

LlamaGPT一个自托管、离线、类似 ChatGPT 的聊天机器人，由 Llama 2 提供支持。100% 私密，不会有任何数据离开你的设备。

在这里插入图片描述

推荐：用 NSDT编辑器快速搭建可编程3D场景

1、如何安装LlamaGPT

LlamaGPT可以安装在任何x86或arm64系统上。

首先确保你已安装 Docker。然后，克隆此存储库并进入目录：

git clone https://github.com/getumbrel/llama-gpt.git
cd llama-gpt

现在可以使用以下任何模型运行 LlamaGPT，具体取决于你的硬件：

模型大小	使用的模型	所需的最低 RAM	如何启动 LlamaGPT
7B	Nous Hermes Llama 2 7B (GGML q4_0)	8GB	docker compose up -d
13B	Nous Hermes Llama 2 13B (GGML q4_0)	16GB	docker compose -f docker-compose-13b.yml up -d
70B	Meta Llama 2 70B Chat (GGML q4_0)	48GB	docker compose -f docker-compose-70b.yml up -d

可以通过 http://localhost:3000 访问 LlamaGPT。

要停止 LlamaGPT，请运行：

docker compose down

2、基准测试

我们在以下硬件上测试了 LlamaGPT 模型，并使用默认系统提示和用户提示：“宇宙如何膨胀？” 温度设置为 0 时保证确定性结果。生成速度是前 10 代的平均值。

Nous Hermes Llama 2 7B (GGML q4_0)

设备	生成速度
M1 Max MacBook Pro (10 64GB RAM)	8.2 令牌/秒
Umbrel Home (16GB RAM)	2.7 令牌/秒
Raspberry Pi 4 (8GB RAM)	0.9 令牌/秒

Nous Hermes Llama 2 13B (GGML q4_0)

设备	生成速度
M1 Max MacBook Pro (64GB RAM)	3.7 令牌/秒
Umbrel Home (16GB RAM)	1.5 令牌/秒

Meta Llama 2 70B 聊天 (GGML q4_0)

不幸的是，我们还没有这个模型的任何基准。

原文链接：LlamaGPT自托管chatbot — BimAnt

新缸中之脑

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。