跨越AI天堑时：行动代号“盘古大模型”-CSDN博客

本文链接：https://blog.csdn.net/R5A81qHe857X8/article/details/120029830

本文讲述了AI开发中存在的碎片化问题，以及预训练大模型如何成为解决这一问题的关键。华为云的盘古大模型项目，旨在通过提供标准化、高效的AI开发基础，降低产业应用的门槛。文章介绍了盘古大模型的研发过程、技术挑战和落地案例，展示了其在AI工业化进程中的重要性与潜力。

摘要由CSDN通过智能技术生成

我采访过一个案例，某工厂的IT负责人想要应用AI，咨询之后却发现开发成本过于高昂，人才、算力、算法等条件都不具备，最后只能作罢。

我认识一位朋友，任职于某家AI技术供应商，他们推出的行业解决方案备受好评，却在实际进入商业化阶段时，发现大量客户都需要定制，只能让公司的AI专家四处奔波，解决用户的细小问题，最后利润却连人员开支都无法覆盖。

还记得一条朋友圈。一位AI开发者在使用之后感叹GPT-3的神奇，同时也惋惜于中文世界缺少类似的NLP预训练大模型。

其实，这些朋友都遇到了同一个问题：一道名为“AI开发”的产业天堑。

当我们谈论AI时，总是会将其效果等同于数据集、实验室里的能力上限，却忽略了在真实的开发、训练、部署中，AI有着太多碎片化与不确定性的因素。

而跨过这道产业天堑，也成为了一场名副其实的全球大赛。这场赛跑中至关重要的一个项目，名为“预训练大模型”。2018年，谷歌AI团队发布了BERT模型，预训练模型的价值一时间成为全球焦点。2020 年 5 月，Open AI公布了拥有 1750 亿参数的 GPT-3 预训练大模型，打破了人类有史以来创建最大神经网络的记录。

与此同时，随着预训练大模型的产业与战略价值水涨船高，致力于将AI打造为新一代信息技术核心抓手的中国产学各界出现了一丝紧迫。

中文世界什么时候能迎来强大可用的预训练大模型？又是否能够冲出GPT-3带来的能力边界？面对AI开发的”天堑”，我们有什么自己的办法？

就在种种声音不断发酵的同时，华为云人工智能领域首席科学家田奇，正在和团队一同发起一次安静的冲锋。

（华为云人工智能领域首席科学家田奇）

这次冲锋的“行动代号”，叫做——盘古大模型。

天堑：“小作坊式”的AI开发困境

试想一下，如果每家企业在进行研发时，都需要自己做螺丝、轴承、齿轮这些基础部件，那整个社会的工业化从何说起？

但在AI领域，却真的会出现这种情况。如今，AI技术的企业渗透率仅仅为4%，距离产业爆发期还有相当长的路要走。究其原因，并不是AI缺乏价值，而是开发过程中存在大量的碎片化因素。每家想要应用AI的企业，可能都需要一些技术水平很高的人才来进行独立的架构设计与调参。这就像每家工厂都需要聘请设计师来设计螺丝，是一种相当粗放、原始的手工作坊模式。