跨越AI天堑时:行动代号“盘古大模型”

本文讲述了AI开发中存在的碎片化问题,以及预训练大模型如何成为解决这一问题的关键。华为云的盘古大模型项目,旨在通过提供标准化、高效的AI开发基础,降低产业应用的门槛。文章介绍了盘古大模型的研发过程、技术挑战和落地案例,展示了其在AI工业化进程中的重要性与潜力。
摘要由CSDN通过智能技术生成

我采访过一个案例,某工厂的IT负责人想要应用AI,咨询之后却发现开发成本过于高昂,人才、算力、算法等条件都不具备,最后只能作罢。

我认识一位朋友,任职于某家AI技术供应商,他们推出的行业解决方案备受好评,却在实际进入商业化阶段时,发现大量客户都需要定制,只能让公司的AI专家四处奔波,解决用户的细小问题,最后利润却连人员开支都无法覆盖。

还记得一条朋友圈。一位AI开发者在使用之后感叹GPT-3的神奇,同时也惋惜于中文世界缺少类似的NLP预训练大模型。

其实,这些朋友都遇到了同一个问题:一道名为“AI开发”的产业天堑。

当我们谈论AI时,总是会将其效果等同于数据集、实验室里的能力上限,却忽略了在真实的开发、训练、部署中,AI有着太多碎片化与不确定性的因素。

而跨过这道产业天堑,也成为了一场名副其实的全球大赛。这场赛跑中至关重要的一个项目,名为“预训练大模型”。2018年,谷歌AI团队发布了BERT模型,预训练模型的价值一时间成为全球焦点。2020 年 5 月,Open AI公布了拥有 1750 亿参数的 GPT-3 预训练大模型,打破了人类有史以来创建最大神经网络的记录。

与此同时,随着预训练大模型的产业与战略价值水涨船高,致力于将AI打造为新一代信息技术核心抓手的中国产学各界出现了一丝紧迫。

中文世界什么时候能迎来强大可用的预训练大模型?又是否能够冲出GPT-3带来的能力边界?面对AI开发的”天堑”,我们有什么自己的办法?

就在种种声音不断发酵的同时,华为云人工智能领域首席科学家田奇,正在和团队一同发起一次安静的冲锋。

(华为云人工智能领域首席科学家田奇)

这次冲锋的“行动代号”,叫做——盘古大模型。

天堑:“小作坊式”的AI开发困境

试想一下,如果每家企业在进行研发时,都需要自己做螺丝、轴承、齿轮这些基础部件,那整个社会的工业化从何说起?

但在AI领域,却真的会出现这种情况。如今,AI技术的企业渗透率仅仅为4%,距离产业爆发期还有相当长的路要走。究其原因,并不是AI缺乏价值,而是开发过程中存在大量的碎片化因素。每家想要应用AI的企业,可能都需要一些技术水平很高的人才来进行独立的架构设计与调参。这就像每家工厂都需要聘请设计师来设计螺丝,是一种相当粗放、原始的手工作坊模式。

来到华为云的田奇,就和同事们共同发现了这样的问题。

加入华为之前,田奇已经是业界知名的AI领域学者。他是美国伊利诺伊大学香槟分校博士、IEEE Fellow,也是原德州大学圣安东尼奥分校计算机系正教授。在高校任教17年之后,带着学术界的前沿思考和科研成果&

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值