书生大模型全链路开源体系1

文章探讨了大模型在人工智能领域的兴起,特别是通用模型的发展,如ChatGPT,以及上海人工智能实验室发布的千亿大模型。介绍了模型的训练、微调、部署及其技术挑战,如内存管理、推理优化和部署方案。还提到了评测工具和应用案例,如OpenCompass和Lagent等。
摘要由CSDN通过智能技术生成

一、大模型成为热门(archive上的LM和LLM)

二、大模型成为发展通用人工智能的重要途径

专用模型————>通用模型

(针对特定任务,一个模型解决一个问题)————>(一个模型应对多种任务、多种模态)

eg:2006年深度学习理论突破,2011大规模语音识别,2012ImageNet竞赛,2014人脸识别,2016围棋比赛,2019德州扑克,2021AlphaFold

现:ChatGPT

三、上海人工智能实验室

1、发布千亿大模型

2、开源20B的模型:

         以不足三分之一的参数量,达到Lama2-70B水平;

         能力:综合考试、知识问答、阅读理解、推理、编程

3、从模型到应用(智能客服、个人助手、行业应用):

  1. 步骤:模型选型(评测)、业务场景复杂度、算力、续训/微调(LoRA、全参数)、是否需要交互(构建智能体)、模型评测、部署模型。

  2. 因此:

4、书生大模型:

  1. (1)数据:

  2. 书生万卷语料库,2TB;OpenDataLab开放数据平台,80TB,含智能标注工具

  3. (2)预训练:InternLM-Train。

  4. 并行训练,高可扩展(8卡到千卡)、兼容主流(HuggingFace、轻量化技术),开箱即用(多种规格语言模型)。

  5. (3)微调:XTuner

  6. 支持:

  7. 增量续训(基座模型学习新知识:垂类领域知识,需大规模数据)(文章、书籍、代码)

  8. 有监督微调(指令对话,少量领域知识)(高质量对话、问答数据)。

  9. LoRA,预训练参数固定,额外引入少量可训练参数,训练代价小。

  10. 兼容多种生态、算法和Nvidia 20系以上的显卡。8GB可以微调7B的模型。

  11. (4)部署:LMDeploy。

  12. 大语言模型特点:

  13. 内存开销大(庞大参数量、采用自回归生成token需要缓存k/v)、动态shape(请求数不确定、token逐个生成数量不定)、模型结构简单(transformer);

  14. 技术挑战:低存储设备(消费级显卡,移动端)、推理(加速token生成,解决动态shape让推理具连续性,有效管理和利用内存)、服务(提升吞吐量,降低请求平均响应时间);

  15. 部署方案:技术点(模型并行、低比特量化、attention优化、计算和访存优化、continuous batching)。

  16. 接口:python、gRPC、Restful;

  17. 轻量化:4bit权重/8bit kv;

  18. 推理引擎:turbomind、pytorch;

  19. 服务:openai-server、gradio、triton inference server。

  20. 领先的推理能力:静态推理性能(固定batch,输入/输出token数量),动态推理性能(真实对话,不定长的输入/输出)

  21. (5)评测:OpenCompass。

  22. 6维度,80评测集,40万题目。

  23. 工具层、方法层、能力层(通用/特色能力)、模型层(基座/对话模型)。

  24. 工具层:分布式评测、提示词工程、评测数据库上报、评测榜单发布、评测报告生成

  25. 方法层:自动化客观评测、基于模型辅助的主管评测、基于人类反馈的主观评测

  26. 通用能力:学科、语言、知识、理解、推理、安全。特色能力:长文本、代码、工具、知识增强

  27. (6)应用:Lagent;AgentLego。

  28. LLM的局限性:最新信息的获取、可靠性、数学计算、工具使用。

  29. 智能体:以LLM为核心,进行规划、推理和执行。Lagent支持多种类型的能力(ReAct、ReWoo、AutoGPT)、多种大模型、丰富的工具。AgentLego,聚焦给LLM提供工具集合,支持多种模型、智能体系统。

  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值