学习笔记：书生·浦语实战营第二期第二课

Crohcirtep

已于 2024-04-05 20:56:37 修改

阅读量882

点赞数 23

文章标签：学习笔记

于 2024-04-05 11:51:13 首次发布

本文链接：https://blog.csdn.net/weixin_51447013/article/details/137383981

版权

3.1 实战部署：InternLM2-Chat-1.8B

3.2 实战部署：八戒-Chat-1.8B

3.3 实战部署：使用 Lagent 运行 InternLM2-Chat-7B 模型

3.4 实践部署：浦语·灵笔2模型（InternLM-XComposer2，文字创作）

3.5 实践部署：浦语·灵笔2模型（InternLM-XComposer2-vl，图片理解）

1. 相关视频和文档

视频地址：轻松玩转书生·浦语大模型趣味 Demo_哔哩哔哩_bilibili
课程文档：Tutorial/helloworld/hello_world.md at camp2 · InternLM/Tutorial (github.com)

2. 视频学习笔记

2.1 Demo实战内容简介与实现

本次课程的重点在于Demo实战，具体可分为4个部分：

其中，第一个内容是基础作业，需要使用 InternLM2-Chat-1.8B 模型生成 300 字的小故事（据我所知，不是所有模型版本都有1.8B的，这个1.8B的模型应该是专门开源出来便于大家实践的，相较于7B和20B，这个1.8B的模型就小很多，在本地也可以比较方便地实现）；第二个内容是实战作业，用到的八戒-Chat-1.8B（模型链接：魔搭社区）是上一期实战营的优秀作业，这个模型也是在 InternLM2-Chat-1.8B 的基础上，借助西游记中八戒相关的台词等语料信息进一步微调而来，在利用此模型进行问答时，AI的回复语气会具有八戒的说话特点，很有意思，与八戒-Chat-1.8B类似的优秀作品（比如嬛嬛-Chat-1.8B，AI的回复语气具有甄嬛的说话特点，模型链接：OpenXLab浦源 - 模型中心）都在官方网站上开源了，也有详细的教程，感兴趣的可以去关注一下；第三个内容和第四个内容是进阶任务，主要是可以体验一下参数量更大的模型，以及书生里面专攻图文理解和图文写作的模型。

** 在视频中，老师很详细地对Demo实战内容的实现过程进行了讲解，考虑到在后面的章节会详细展示课后作业（也是跟着教程走的），所以在这里就不对实现过程做赘述了。

2.2 书生·浦语大模型兴趣小组

在实战过程中，会对书生·浦语的模型及各类工具有一些初步体验，书生·浦语也设立了很多兴趣小组，有意向的可以选择性地加入，兴趣小组会鼓励大家进行开发探索，提供一些支持。

3. 课后作业：Demo实战

3.1 实战部署：InternLM2-Chat-1.8B

3.1.1 在平台（InternStudio）创建开发机，启动开发机并进入：

3.1.2 进入开发机后，在 jupyter lab的 terminal 中输入环境配置命令 (需要时间，耐心等待)：

studio-conda -o internlm-base -t demo

3.1.3 配置完成后，进入所创建的环境并完成相关包的安装：

conda activate demo
pip install huggingface-hub==0.17.3
pip install transformers==4.34 
pip install psutil==5.9.8
pip install accelerate==0.24.1
pip install streamlit==1.32.2 
pip install matplotlib==3.8.3 
pip install modelscope==1.9.5
pip install sentencepiece==0.1.99

3.1.4 按路径创建文件夹并进入对应目录（用于后续下载 InternLM2-Chat-1.8B 模型）

mkdir -p /root/demo
touch /root/demo/cli_demo.py
touch /root/demo/download_mini.py
cd /root/demo

3.1.5 从左侧文件夹目录，双击进入“demo”文件夹，双击打开 /root/demo/download_mini.py 文件，复制以下代码并保存：

import os
from modelscope.hub.snapshot_download import snapshot_download

# 创建保存模型目录
os.system("mkdir /root/models")

# save_dir是模型保存到本地的目录
save_dir="/root/models"

snapshot_download("Shanghai_AI_Laboratory/internlm2-chat-1_8b", 
                  cache_dir=save_dir, 
                  revision='v1.1.0')

3.1.6 回到 jupyter lab的 terminal 中，执行以下命令，下载模型参数文件（需要时间，耐心等待）：

python /root/demo/download_mini.py

3.1.7 双击打开 /root/demo/cli_demo.py 文件，复制以下代码并保存：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM


model_name_or_path = "/root/models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')
model = model.eval()

system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""

messages = [(system_prompt, '')]

print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")

while True:
    input_text = input("\nUser  >>> ")
    input_text = input_text.replace(' ', '')
    if input_text == "exit":
        break

    length = 0
    for response, _ in model.stream_chat(tokenizer, input_text, messages):
        if response is not None:
            print(response[length:], flush=True, end="")
            length = len(response)

3.1.8 回到 jupyter lab的 terminal 中，输入命令，执行 Demo 程序（需要时间，耐心等待）：

conda activate demo
python /root/demo/cli_demo.py

3.1.9 等待模型加载完成后，就可以进行交流了，例如让它生成一个300字的小故事：

使用体验：整体过程还是比较顺利的，生成故事也比较流畅，除了让它生成300字的小故事，还尝试让它介绍中国传统节日，整体回答比较准确，能较好地实现交互沟通

** 提示：完成沟通任务后，输入exit即可退出

3.2 实战部署：八戒-Chat-1.8B

3.2.1 回到 jupyter lab的 terminal 中，输入命令激活环境，并获取仓库内的demo文件：

conda activate demo
cd /root/
git clone https://gitee.com/InternLM/Tutorial -b camp2
# git clone https://github.com/InternLM/Tutorial -b camp2
cd /root/Tutorial

3.2.2 下载模型文件（需要时间，耐心等待）：

python /root/Tutorial/helloworld/bajie_download.py

3.2.3 模型下载完成后，输入运行命令：

streamlit run /root/Tutorial/helloworld/bajie_chat.py --server.address 127.0.0.1 --server.port 6006

在上述代码运行时，需要对端口环境配置本地 PowerShell 。使用快捷键组合 Windows + R 打开指令界面，并输入powershell按下回车键，输入以下命令，实现从本地使用 ssh 连接 studio 的端口：

# 需要将下方端口号 41421 替换成自己开发机的端口号
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 41421

** 补充说明：开发机的端口号及密码的查询方式：

3.2.4 回到 jupyter lab的 terminal 中，打开所给URL（需要时间，耐心等待）：

3.2.5 与“八戒”进行沟通

使用体验：相较于与InternLM2-Chat-1.8B进行沟通，八戒的回复速度明显变慢了很多，另一方面，同样是让模型创作一个300字的小故事，八戒的个性特点太强，从某种程度上来说，可能不如InternLM2-Chat-1.8B的创作结果那样具有趣味性

3.3 实战部署：使用 Lagent 运行 InternLM2-Chat-7B 模型

3.3.1 关闭开发机，升级配置到 30% A100，启动开发机并进入

3.3.2 激活 conda 环境，进入目标路径，使用 git 命令下载 Lagent 相关的代码库：

conda activate demo
cd /root/demo
git clone https://gitee.com/internlm/lagent.git
# git clone https://github.com/internlm/lagent.git
cd /root/demo/lagent
git checkout 581d9fb8987a5d9b72bb9ebd37a95efd47d479ac
pip install -e .

3.3.3 下载完成后，进入lagent路径，输入指令构造软链接快捷访问方式：

cd /root/demo/lagent
ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b /root/models/internlm2-chat-7b

3.3.4 通过左侧目录，打开 lagent 路径下 examples/internlm2_agent_web_demo_hf.py 文件，修改对应位置（71行左右）的代码并保存：

3.3.5 此步骤与3.2.3相同，目的是实现从本地使用 ssh 连接 studio 的端口，先在开发机的 jupyter lab的 terminal 中输入以下命令完成模型的加载：

streamlit run /root/Tutorial/helloworld/bajie_chat.py --server.address 127.0.0.1 --server.port 6006

在上述代码运行时，需要对端口环境配置本地 PowerShell 。使用快捷键组合 Windows + R 打开指令界面，并输入powershell按下回车键，输入以下命令：

# 需要将下方端口号 41421 替换成自己开发机的端口号
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 41421

3.3.6 此步骤与3.2.4相同，回到 jupyter lab的 terminal 中，打开所给URL（需要时间，耐心等待）

3.3.7 进行交互

** 补充：尝试了不勾选左侧的“数据分析”，得到的回答就是一般的解题思路及结果，没有代码理解这一部分，例如告诉你应该先把带未知数的放到等式左边，然后再怎么怎么解，最后得出结果

使用体验：在运行速度方面，感觉解方程不如直接用MATLAB那样快，而且目前只是尝试了较为简单的方程组，不知道在解更难的题的时候会有怎样的表现。但是另一方面，它的分析过程确实比较详细，也融合了代码理解，这是可圈可点的，有助于梳理思路

3.4 实践部署：浦语·灵笔2模型（InternLM-XComposer2，文字创作）

3.4.1 此步骤与3.3.1类似，关闭开发机，升级配置到 50% A100，启动开发机并进入

3.4.2 激活 conda 环境，下载 InternLM-XComposer 仓库相关的代码资源：

conda activate demo
# 补充环境包
pip install timm==0.4.12 sentencepiece==0.1.99 markdown2==2.4.10 xlsxwriter==3.1.2 gradio==4.13.0 modelscope==1.9.5
# 切换路径，下载目标文件
cd /root/demo
git clone https://gitee.com/internlm/InternLM-XComposer.git
# git clone https://github.com/internlm/InternLM-XComposer.git
cd /root/demo/InternLM-XComposer
git checkout f31220eddca2cf6246ee2ddf8e375a40457ff626

3.4.3 下载完成后，输入命令构造软链接快捷访问方式：

ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-7b /root/models/internlm-xcomposer2-7b
ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-vl-7b /root/models/internlm-xcomposer2-vl-7b

3.4.4 继续输入指令，用于启动 InternLM-XComposer2，同时配置端口，实现从本地使用 ssh 连接 studio 的端口（需要时间，耐心等待）：

cd /root/demo/InternLM-XComposer
python /root/demo/InternLM-XComposer/examples/gradio_demo_composition.py  \
--code_path /root/models/internlm-xcomposer2-7b \
--private \
--num_gpus 1 \
--port 6006

在上述代码运行时，需要对端口环境配置本地 PowerShell 。使用快捷键组合 Windows + R 打开指令界面，并输入powershell按下回车键，输入以下命令：

# 需要将下方端口号 41421 替换成自己开发机的端口号
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 41421

3.4.5 此步骤与3.2.4相同，回到 jupyter lab的 terminal 中，打开所给URL（需要时间，耐心等待）

3.4.6 利用提示性的语言创作图文并茂的作品

教程中的示例：

将提示换成AI生成的200字的小故事，再看一下灵笔的创作能力如何：

使用体验：生成结果的质量跟所给提示有关，根据以上两个尝试，不难看出前一个提示详细明确，所以它的文字创作结果也是比较好的，而后者就没这么好的效果了，更像是在做阅读理解

3.5 实践部署：浦语·灵笔2模型（InternLM-XComposer2-vl，图片理解）

3.5.1 同样需要升级配置到 50% A100（建议先完成3.4的任务，完成模型的下载以及其他操作）

3.5.2 关闭并重新启动一个新的 terminal，激活环境，切换路径，启动 InternLM-XComposer2-vl（需要时间，耐心等待）：

conda activate demo

cd /root/demo/InternLM-XComposer
python /root/demo/InternLM-XComposer/examples/gradio_demo_chat.py  \
--code_path /root/models/internlm-xcomposer2-vl-7b \
--private \
--num_gpus 1 \
--port 6006

3.5.3 打开所给URL，输入图片，进行图片理解