书生·浦语大模型实战营 | 第1次学习笔记

前言

书生·浦语大模型应用实战营 第二期正在开营,欢迎大家来学习。(参与链接:https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqgicon-default.png?t=N7T8https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqg

第一堂课的视频链接:https://m.bilibili.com/video/BV1Vx421X72Dicon-default.png?t=N7T8https://m.bilibili.com/video/BV1Vx421X72D

本次笔记是学习完第一堂课,结合自己关心内容而创作,更偏向个人。尽管有很多细节丢失,但组织出来的内容仍反映本节课的关键知识、也是我的收获,与大家分享。

论述

大模型功能开发流程

以下是比较典型的大模型功能开发要经历的流程,但实际情况可能会更加复杂,也没必要去都呈现出来。所以我们学习这个就行。知道步骤进行原因,具体情况灵活应变

步骤一(步骤数字以最复杂的情况为举例):挑选模型

现在想象下我们要开发一个大模型应用。从接到任务到真正把功能实现出来,该经历怎样的流程?

大模型功能是为了满足某个业务需求的,首先我们得挑选合适的大模型,大家知道不同的大模型对同一个任务表现是不一样的,就拿Claude2来说,模型综合能力不及GPT-4 Turbo,但是在学术相关对话,表现出来的特定能力是明显比GPT-4 Turbo好的。

完成这一步骤,可能需要你有些经验,或者你也可以看权威些的排行榜。

步骤二:第一次模型评估

刚刚是你主观上觉得Ok、或者别人说的,但是实际怎么样呢?你得基于客观的测试,但到底是不是能够满足需要。

如果直接就满足了,那就直接可以部署模型了。达不到需要该怎么办?

我们得去微调大模型

步骤三:微调大模型

我们要做判断,现在我有没有微调所需要的资源?具体是硬件资源、和训练所需的语料资源。做好判断之后就进行微调的环节了

 续训,也就是全参数微调,因为要将训练大量的语料,往往需要更长时间。

步骤四:构建智能体

 如果大模型要与环境进行交互,比如与数据库的交互或者调用什么插件等,构建智能体是很好的策略。在具体情况下你可以判断一下,如果需要推荐你构建智能体

步骤五:第二次模型评估

功能始终是为了满足某种需要的,所以在我们改造模型后,还是得看满足了没有,是不是要继续调整。我们对模型进行第二次评估。

 步骤六:模型部署

最后就是把模型嵌入应用中,部署好自己的模型就好了

这就是总的图

 这是我学到的一个关键知识,它让我知道我以后面对我的项目的时候,该怎么办

书生·浦语全链条开源开放体系

听完课似乎我脑袋里留下的第二句话是:“书生·浦语对于开发的各个环节都提供了技术支持”。

 大家可以把各个技术对应到上面我们总结的开发流程中,看什么地方我可以用到什么技术。

~~~~~~

以上就是我本篇想讲的所有内容了,如果这篇文章对你有价值的话,还请点个赞,你的支持对我非常重要!

我是阿航,一位胆大包天、梦想成为大牛的学生~ 

我们下篇文章接着聊

  • 17
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值