Llama3微调、部署

橙子tab

已于 2024-05-19 23:49:58 修改

阅读量444

点赞数 3

文章标签：人工智能语言模型

于 2024-05-19 23:49:04 首次发布

本文链接：https://blog.csdn.net/weixin_43234950/article/details/139050658

版权

文章目录

前言
一、LLama3的web部署
二、XTuner 微调 Llama3 个人小助手认知
三、XTuner 微调 Llama3 图片理解多模态
四、LMDeploy 高效部署 Llama3 实践
五、Llama 3 Agent 能力体验+微调（Lagent 版）
总结
参考

前言

五一期间参与了书生·蒲语的活动，其中使用InternStudio算力平台和Xtuner库进行。下面是一些具体的项目和实践截图。

一、LLama3的web部署

这里所使用的库是streamlit，直接运行命令行，即可在本地完成web部署。

streamlit run ~/Llama3-Tutorial/tools/internstudio_web_demo.py \
  ~/model/Meta-Llama-3-8B-Instruct

在这里插入图片描述

二、XTuner 微调 Llama3 个人小助手认知

这一步主要使用了下面这条数据进行过拟合：

[
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    },
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    }
]

使用的是Qlora微调方式，并使用deepspeed进行加速。微调后，可以改变模型的自我认知，但同时由于过拟合，会出现问什么问题都回答这句话。（这里由于笔者没有保存截图，就不贴了）