书生·浦语大模型实战营 学习笔记 第二课

目录

1. 主要内容

1. 基础实战:部署InternLM2-Chat-1.8B

2. 基础实战: 部署八戒-Chat-1.8B模型

3. 进阶实战:使用Lagent运行InternLM2-Chat-7B模型

4. 进阶实战:部署浦语·灵笔2模型

1) 图文写作实战

2)图文理解实战


这一讲主要聚焦如何进行demo实战,具体tutorial参考Tutorial/helloworld/hello_world.md at camp2 · InternLM/Tutorial · GitHub

1. 主要内容

基础训练:

1)实战部署InternLM2-Chat-1.8B,以本地成功部署为实现目标

2)实战部署八戒-Chat-1.8B,旨在学习如何部署自定义模型,如何实现本地端口映射

进阶训练:

1)运行Lagent智能体demo (以InternLM2-Chat-7B为基础),使用软连接,体验智能体在数据分析下的应用效果

2)实践灵笔InternLM-XComposer2,进行多模态实践,通过灵笔实现更强大的图文生成式写作

1. 基础实战:部署InternLM2-Chat-1.8B

配置好各种基础环境后,下载InternLM2-Chat-1.8B模型。

然后输入命令,执行demo程序,就可以等待模型加载完成了。

此时可以与模型进行交互,“请创作一个300字的小故事”,结果如下:

再来一个,哈哈

2. 基础实战: 部署八戒-Chat-1.8B模型

这种角色扮演类模型,都是运用InternLM2-Chat-1.8B模型经过微调训练的成果。以八戒这个模型举例,该模型是利用《西游记》剧本中所以关于猪八戒的台词和语句已经LLM API生成的相关数据结果,进行全量微调得到的猪八戒聊天模型。这个模型的低部署条件能够问哦后续工作降低算力门槛,却又能以较低的训练成本达到不错的角色扮演能力。

下载/运行Chat-八戒Demo以后,需要对端口环境配置本地PowerShell。配置完成后打开http://127.0.0.1:6006等待加载完成即可进行对话(加载确实有点慢)

八戒老哥确实很健谈哈哈哈!

3. 进阶实战:使用Lagent运行InternLM2-Chat-7B模型

Lagent是一个轻量级的、开源的基于大语言模型的智能体框架,支持用户快速地将一个大语言模型转变为多种类型的智能体,并提供了一些典型工具为大语言模型赋能。

4. 进阶实战:部署浦语·灵笔2模型

浦语·灵笔2是基于书生·浦语2大语言模型研发的突破性图文多模态大模型,具有非凡的图文写作和图像理解能力,具有:

1. 自由指令输入的图文写作能力,支持包括大纲、文章细节要求、参考图片等等图文指令输入

2. 准确的图文问题理解能力,可以准确回复各种图文问答难题,在识别、感知、细节描述、视觉推理等能力上表现惊人

3. 接触的综合能力,在部分评测中甚至超过GPT-4V和GeminiPro。

1) 图文写作实战

加载Xcomposer2,并给定创作图文并茂文章的输入:

稍作等待,就可以生成不少于800字的图文并茂的长文章了:

等等。。(文章没全部截完)

2)图文理解实战

尝试了一下多模态对话,输入了一张在加拿大秋天拍摄的照片,请分析图中内容,以下是结果:

  • 28
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
八戒-Chat是利用《西游记》剧本中所有关于猪八戒的台词和语句,以及Chat-GPT-3.5生成的相关问题结果,基于Internlm进行QLoRA微调得到的模仿猪八戒语气的聊天语言模型。 GPT, 通常指的是“Generative Pre-trained Transformer”(生成式预训练转换器),是一个在自然语言处理(NLP)领域非常流行的深度学习模型架构。GPT模型由OpenAI公司开发,并在多个NLP任务上取得了显著的性能提升。 GPT模型的核心是一个多层Transformer解码器结构,它通过在海量的文本数据上进行预训练来学习语言的规律。这种预训练方式使得GPT模型能够捕捉到丰富的上下文信息,并生成流畅、自然的文本。 GPT模型的训练过程可以分为两个阶段: 预训练阶段:在这个阶段,模型会接触到大量的文本数据,并通过无监督学习的方式学习语言的结构和规律。具体来说,模型会尝试预测文本序列中的下一个词或短语,从而学习到语言的语法、语义和上下文信息。 微调阶段(也称为下游任务训练):在预训练完成后,模型会被应用到具体的NLP任务中,如文本分类、机器翻译、问答系统等。在这个阶段,模型会使用有标签的数据进行微调,以适应特定任务的需求。通过微调,模型能够学习到与任务相关的特定知识,并进一步提高在该任务上的性能。 GPT模型的优势在于其强大的生成能力和对上下文信息的捕捉能力。这使得GPT模型在自然语言生成、文本摘要、对话系统等领域具有广泛的应用前景。同时,GPT模型也面临一些挑战,如计算资源消耗大、训练时间长等问题。为了解决这些问题,研究人员不断提出新的优化方法和扩展模型架构,如GPT-2、GPT-3等,以进一步提高模型的性能和效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值