10分钟私有化部署一个大语言模型:用最强开源大语言模型LLama3+AnythingLLM,打造一个知识库

     前言

    4月18日,Meta终于正式发布全新一代开源模型Llama3,为训练这个模型,投入了49152块H100的GPU,经大咖们评测,这是比肩GPT4的开源大型,下图是多个场景的测试对比。

688340ac63234acb89cbfcd82dee0e5b.png

       出于个人兴趣和好奇,我也花了点时间进行了私有化的部署,并基于AnythingLLM打造了一个知识库,现分享一下部署的过程,希望越来越多的人投入到大模型的应用开发中,一起交流打造良好的生态。

     先展示成果

      我上传了这篇文章《中国信通院余晓晖:推动算力基础设施高质量发展》到大模型知识库中,文章有一段内容如下:

3d69d57c1b8c426c945ba1853aaf5c1d.png

      对大模型提问,如下结果,还是令人很满意的:

      5af7fab5e82443b5bf542b47cceab0ef.png

      知识库整体架构

       使用Ollama部署Llama3,由于Llama3自身对中文支持不好,所以此次部署的是王慎执博士对llama3微调之后的8B版本,大模型采用8位量化,向量数据库用的是LanceDB。知识库整体架构及访问流程如下:

66111cea9c2246a796ef859d5a3a6c11.png

部署

基于以上架构,需要部署的组件时Ollama,Llama3,AnythingLLM,LanceDB(AnythingLLM自带,不需要单独部署)

部署Ollama及Llama3

在linux服务器中执行命令,在线下载并安装Ollama和Llama3

#安装ollama
curl -fsSL https://ollama.com/install.sh | sh
#下载llama3
ollama run wangshenzhi/llama3-8b-chinese-chat-ollama-q8

修改ollama配置

vim /etc/systemd/system/ollama.service

6f67b90b2f4242a5b61655b978ed2838.png

#重启ollama
systemctl restart ollama
systemctl daemon-reload
#将ollama访问端口加到防火墙
firewall-cmd --zone=public --add-port=11434/tcp --permanent
#重启防火墙
firewall-cmd --reload

部署AnythingLLM

以下是下载的网站,根据系统的不同,下载对应的版本安装即可

Download AnythingLLM for DesktopDownload the ultimate "all in one" chatbot that allows you to use any LLM, embedder, and vector database all in a single application that runs on your desktop. 100% privately.https://useanything.com/download

配置AnythingLLM

打开AnythingLLM,页面如下:

ecfb69eb6f7f4120aeddb923351e116c.png

选择Ollama,输入Ollama的服务器地址,选择已经部署好的大模型,一直点右边的箭头到最后完成即可。

c2b908e9ae634dd096dd8721c16c9114.png

点击小扳手进入设置界面

8e04d37ea86641ebb7b897a0690e4bf5.png

查看大模型的参数配置,输入大模型的本地访问地址

5f670a0d04034512b4ebfc51c6352d5d.png

配置Embedding模型的参数,这里也配置大模型的地址

a1c5bd28d841444ca39baf678c6c387b.png

调整Chunk大小,可以根据回答的结果准确性微调

1da39d27f9134fc99708c2c16f4709a7.png

配置向量数据库

0b5fd24fc28e44418e2085c44d9f4619.png

workspace配置

配置对话模式为Query,仅从知识库中获取答案并回答

31677463b0654021977501ba1837f96a.png

进入主界面后,创建一个workspace,点击上传箭头,会弹出一个页面,可以将文件上传到知识库

5970801f0ac84ae9a87cc5bf8b2b802d.png

上次文件之后,选中后,点击Move to Workspace移动到右边的框中

61686d81085b4b3a8efeda29f80a8556.png

执行右下角的Save and Embed,会将文件向量化后存储到向量数据库中9d92f1bc4751459c859ac1a08e7580eb.png

返回页面即可跟大模型对话,获取想要的答案

581b4ae6f63449fc83242a1a07a397c2.png

 

  • 30
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Llama3-8b是一个开源的聊天机器人模型,可以用于自然语言处理和对话生成任务。如果您希望进行私有化部署,可以按照以下步骤进行操作: 1. 获取源代码:首先,您需要从Llama3-8b的开源代码库中获取源代码。您可以在GitHub上找到该项目,并将其克隆到本地。 2. 环境配置:在进行私有化部署之前,您需要配置适当的环境。确保您的系统满足所需的软件和硬件要求,并安装必要的依赖项。 3. 数据准备:为了训练和使用Llama3-8b模型,您需要准备相应的数据集。这可能包括对话数据、语料库等。确保数据集的质量和多样性,以提高模型的性能。 4. 模型训练:使用准备好的数据集,您可以开始训练Llama3-8b模型。根据您的需求和资源情况,您可以选择在单个GPU或多个GPU上进行训练。训练过程可能需要一定的时间和计算资源。 5. 模型部署:一旦训练完成,您可以将Llama3-8b模型部署私有环境中。这可能涉及将模型加载到服务器或云平台,并设置相应的API接口供其他应用程序调用。 6. 安全性和隐私保护:在进行私有化部署时,确保采取适当的安全措施来保护用户数据和系统安全。这可能包括数据加密、访问控制、身份验证等。 7. 持续优化和更新:私有化部署后,您可以根据实际需求对Llama3-8b模型进行持续优化和更新。这可能包括增加新的训练数据、微调模型参数等。 希望以上步骤对您进行Llama3-8b的私有化部署提供了一些指导。如果您有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值