书生·浦语大模型全链路开源体系,大模型已成为通用人工智能解决多种任务和多种模态的重要途径。此大模型具有超长上下文能力,综合性能全面提升,能够实现结构化创作和可靠的数据分析,实现一对多的通用大模型。本次课程主要对大语言模型进行了一次大致介绍。
通用大模型成为人工智能发展趋势,书生浦语大模型开源历程
模型在7月、9月和1月的升级,包括支持多模态、8K语境和不同尺寸的模型
大模型2.0提供了不同尺寸和类型,支持多语言和多模态任务,语言知识、推理、数学、代码等各方面有不错的表现,同时还介绍了模型的应用和数据分析功能。
下图是各代模型性能的直观对比图,随着迭代训练整体的性能在不断提升
20B模型在推理数学代码等方面的性能优于GP3.5和germini pro,模型在综合性能方面达到同量级的开源模型领先水平,模型内生的计算能力和数据分析功能能够处理复杂的任务和数据分析
从模型到应用典型流程
模型选型是第一步,需要考虑模型的复杂度和算力,根据实验设备算力是否足够选择微调,在训练完模型后对模型做一个评测,使评测指标达到效果。
全链路开源体系,包括数据、预训练、微调、部署、评测、应用等环节
open compass 2.0思南大模型评测体系,包括评测框架的开发和开源、评测基准社区的建立以及对大模型能力提升的分析。
open compass 2.0思南大模型评测体系,open compass已经适配超过100个评测集,是国内最完善的评测体系之一
英特尔开源模型推理和部署工具的评测和发展趋势,以及智能体框架和多媒体多模态智能体工具箱的使用和开发
开源社区发展趋势,中轻量级模型性能接近商业闭源模型,Mdepot提供全链条部署解决方案,支持模型轻量化、推理引擎、服务模块等。
智能体框架Legend支持多种智能体能力,提供多模态AI工具箱AgentLego和多媒体算法功能。