目录
大模型成为发展通用人工智能的重要途径
专用模型:针对特定任务,一个模型解决一个问题
通用大模型:一个模型应对多种任务、多种模态
书生·浦语大模型开源历程
![](https://i-blog.csdnimg.cn/blog_migrate/414acbf8a3167f16bee3ab8e800345d8.jpeg)
书生·浦语大模型系列
7B 20B已经开源
书生·浦语20B开源大模型性能
![](https://i-blog.csdnimg.cn/blog_migrate/a309bd7e77d483e1def80deacfb9bc39.jpeg)
从模型到应用
大模型 到智能客服、个人助手 行业应用 之间还有一段距离 需要借助一些工具或者框架去协助大模型完成到实际应用
模型到应用的流程框架
在一些简单的业务场景里面,比如一些通用的对话,可以直接使用大模型然后通过一些Prompt engineering 的方式 接入到场景。
书生·浦语全链条开源开放体系
数据
openDatalab 数据平台
预训练
微调
增量训练的数据格式一般和预训练的数据格式一样,有监督微调的形式,数据量比增量续训和预训练的数据都要小一些。
微调平台XTuner
评测
评测的全面性还不够不能满足现在大模型的一些发展的需求
评测平台 OpenCompass
比较全面的评测体系可以避免只关注大模型的某个方面或者只关注他的某一个能力维度。
openCompass 存在着一些亮点
- 丰富的模型支持 开源模型 or api 做一站式的模型评测。
- 分布式高效评测 主要为了评测千亿级的大模型在几十个数据集 几十万的题目上去评测。
- 便捷的数据接口 社区用户可以根据自身的需求快速添加一些自定义的数据集(比如关注模型的某一方面的能力或者针对评测有一些新的研究 可以基于open compass 把自己构建的数据集接入进来 批量的进行模型评测 )
- 敏捷的能力迭代 (每周更新大模型的能力的榜单)
部署
部署平台LMDeploy
应用
模型如何去驱动一个更复杂的应用?
搭建一个包括不同的模块的智能体框架
智能体 是以LLM为核心进行一些规划、推理、执行的框架
可能会去调用不同的工具,执行不同的动作(网络搜索 python代码解释器)利用LLM强大的推理能力去做一些规划或者调用链的设计
Lagent 是搭建智能体的整个框架
AgentLego 是给大模型提供更多的工具集合,使得LLM有可调用的工具