概 述
本项目通过搭建高性能 GPU 计算集群、训练通用大语言模型、训练垂类大语言模型、搭建大语言模型微调平台、搭建大语言模型应用开放平台等核心模块,旨在打造大语言模型服务和应用平台,为大语言模型技术的研究和应用提供一个开放、可扩展、可协作的环境。这个平台除了通用大语言模型外,还提供大量共享的数据集、算法库、模型微调工具等资源供开发者使用,同时大语言模型应用开放平台提供一整套完整的大语言模型生态应用工具链,从而加速大语言模型的训练以及大语言模型生态应用的开发和使用过程。
需求分析
随着生成式人工智能技术步入深化阶段,以 chatGPT 为代表的大语言模型潜力凸显,在各个领域得到了广泛的认同和应用。2022 年全球 GenAI 市场整体收入为 400 亿美元,预计 2027 年及 2032 年将分别达到 3990 亿美元和 1.3 万亿美元,2022~2032 年复合增长率高达 42%。而国内众多行业企业受到算力和数据等因素的制约,不能快速高效地使用最新的 AI 工具和成果。因此,建设一个高性能、稳定可靠的大模型开放平台,从而降低人工智能应用的门槛,提高开发效率和降低开发成本,促进人工智能领域的合作与交流,加快人工智能技术的创新与应用,成为了一个非常有意义的工作。
核心能力和技术创新点:
- 1860 亿参数规模的基础大模型: