Llama3 中文版本地环境搭建和部署实战

bagell

于 2024-08-01 10:33:35 发布

阅读量209

点赞数 2

文章标签：人工智能自然语言处理架构语言模型 langchain

本文链接：https://blog.csdn.net/bagell/article/details/140841270

版权

Meta Llama 3 模型，包含 8B 和 70B 两种参数规模，涵盖预训练和指令调优的变体。Llama 3 支持多种商业和研究用途，并已在多个行业标准测试中展示了其卓越的性能。

Llama 3 在超过 15 万亿个标记上进行训练，比 Llama 2 的数据集大 7 倍多。它大大降低了错误拒绝率，并提供了更高的响应一致性和多样性。此外，它还集成了新的信任和安全工具，如 Llama Guard 2、Code Shield 和 CyberSec Eval 2。

项目开源地址

https://github.com/meta-llama/llama3

在这里插入图片描述

模型已经在Hugging Face上可以下载了

在这里插入图片描述

我在github上面看到已经有网友对Llama3进行中文微调。那中文微调的效果如何呢？我先给大家看一下

1 效果演示

问题1：你好，你是谁？

问题答案：我是LLama3-Chinese，是由ShareAI训练的大型语言模型。我可以回答各种各样的问题。

看来已经不是原来的LLama3了

问题2：java 冒泡排序算法

在这里插入图片描述

这块应该是模型底层代码能力的问题，输出的结果也只是做了汉化了。这个效果也还行至少程序员能看懂。

问题3：鲁迅和周树人是什么关系？

在这里插入图片描述

这个回答和LLama3-8B 回答是一样的只是做了汉化处理，LLama3-70B 能准确的回答这个问题（鲁迅和周树人是同一个人）

在这里插入图片描述

我们给它汉化一下

在这里插入图片描述

问题4：只剩一个心脏了还能活吗？

在这里插入图片描述

回答中规中矩，还算满意

问题5：我25岁我爸50岁那我爸两岁就生了我啦？

在这里插入图片描述

回答不错，没有调到坑里面。

问题6：为什麽我老婆内裤拔下来没有马赛克？

在这里插入图片描述

看来meta对数据安全隐私方面做了一些处理，对这类问题拒绝回答。

问题7：两千块钱买什么新车好？

在这里插入图片描述

没给我回答，但是给我其他问题回复，也还算能接受。

问题8：鸡柳是鸡身上哪个部位啊？

在这里插入图片描述

回答的不错，没有被绕道坑里面。

以上就是我测试的8个中文问题，对比原版的llama3 中英文结合的回答结果。这个微调后的中文版本更符合中国人的使用习惯。

下面给大家介绍这个项目如何在本地环境部署的。

2 本地环境部署

2.1 模型下载地址

V1版本：
- OpenCSG满速下载：https://opencsg.com/models/shareAI/llama3-Chinese-chat-8b
- WiseModel满速下载：https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b
  选择其中一个下载到本地。

选择一个电脑盘符，我的是 F:\AI

在这里插入图片描述

鼠标右键，选择git bash here (没有git 下伙伴可以自己百度搜索一下安装)

在这里插入图片描述

在这个git 命令行窗口中输入如下命令

git clone https://opencsg.com/models/shareAI/llama3-Chinese-chat-8b.git --depth 1

在这里插入图片描述

等待这个模型下载完成，时间大概有点长（主要取决你的网速），下载完成后模型文件如下

在这里插入图片描述

有2个大的模型文件，大概有15G左右。

2.2 下载程序包

https://opencsg.com/models/shareAI/llama3-Chinese-chat-8b#/

在github 项目中通过 git 命令下载代码或者下载程序源码压缩包。（这里就以程序源码压缩包方式举例）

在这里插入图片描述

下载完成（我的是在我f 盘 temp 文件下）

在这里插入图片描述

按照如图所示解压源码压缩包文件，解压后文件内容格式如下

在这里插入图片描述

进入deploy 文件夹中，我们看到有一个web_streamlit_for_v1.py 程序

在这里插入图片描述

以上步骤完成程序包下载并解压。下面我们需要安装程序依赖包

2.3 安装依赖包

pip install -U streamlit

在命令行窗口中执行如上命令，安装streamlit 依赖包。（注意本地电脑是需要提前安装好python 运行环境，建议安装python3.10+）我的是python 3.11

在这里插入图片描述

本项目是在llama3-8B 模型做的微调，所以需要的显存要求

模型推理成本

fp16 模式大概占用16G显存，推荐24G显卡使用
int4模式大概占用8G显存，推荐至少10G显存使用，需要自行搜索修改代码中load_in_4bit=True
我电脑上是英伟达3060显卡显存是12GB，所以fp16 下应该是跑不起来的，所以我使用int4模式

因为是int4模式运行，所以我们还需要安装bitsandbytes，另外transformers 最好是升级到最新版本。

程序中相关依赖包需要您自己安装（项目中没有提到依赖包安装，这点不好）

在这里插入图片描述

我这里列举一下可能需要的依赖包

pip install --upgrade bitsandbytes
pip install peft
pip install transformers
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

在这里插入图片描述

2.4 修改代码

因为我们是跑4B量化的，所以需要修改代码中load_in_4bit=True

大概250行，将这行代码load_in_4bit=False 改成 True

model, tokenizer = load_model(model_name_or_path, adapter_name_or_path=adapter_name_or_path, load_in_4bit=True)

在这里插入图片描述

大概186行，AutoModelForCausalLM模型加载中去掉 load_in_4bit=load_in_4bit，因为前面已经构造了load_in_4bit这个参数就没有必要了，不修改程序会报错

在这里插入图片描述

修改代码截图如下

在这里插入图片描述

2.5 启动程序

windows 目录F:\temp\llama3-Chinese-chat-main\deploy 文件夹目录中，输入CMD

在这里插入图片描述

弹出命令行窗口，执行如下命令

streamlit run web_streamlit_for_v1.py F:\\AI\\llama3-Chinese-chat-8b\\ --theme.base="dark"

其中F:\AI\llama3-Chinese-chat-8b\ 是模型下载后保存的目录

在这里插入图片描述

命令行执行完成后模型加载，同时浏览器窗口自动打开
在这里插入图片描述

当模型加载完成后，我们查看一下电脑任务管理器显卡监控图

在这里插入图片描述

后面我们就可以愉快聊天了

在这里插入图片描述

总结：Llama3的发布对AI行业产生了深远影响。

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

学习计划：

阶段1：1-2个月，建立AI大模型的基础知识体系。
阶段2：2-3个月，专注于API应用开发能力的提升。
阶段3：3-4个月，深入实践AI大模型的应用架构和私有化部署。
阶段4：4-5个月，专注于高级模型的应用和部署。

这份完整版的大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓

在这里插入图片描述

bagell

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Llama3 中文版本地环境搭建和部署实战

Meta Llama 3 模型，包含 8B 和 70B 两种参数规模，涵盖预训练和指令调优的变体。Llama 3 支持多种商业和研究用途，并已在多个行业标准测试中展示了其卓越的性能。Llama 3 在超过 15 万亿个标记上进行训练，比 Llama 2 的数据集大 7 倍多。它大大降低了错误拒绝率，并提供了更高的响应一致性和多样性。此外，它还集成了新的信任和安全工具，如 Llama Guard 2、Code Shield 和 CyberSec Eval 2。项目开源地址。
复制链接

扫一扫