AI大模型的那些事儿

抛开清华博士割韭菜这件事儿,中美在人工智能领域存在的巨大差距。

一、大语言模型发展现状

大型语言模型的概念实际上数年前就已提出,但直到去年,谷歌和OpenAI才取得了重大突破,引领了市场的热潮。随后,各种语言模型和人工智能应用开始迅速涌现,技术迭代频繁,吸引了大量付费用户和免费试用者。

如果将人工智能比作一台电脑,那么英伟达的显卡就是基础设备,提供必要的算力来支持原创的大型模型运行。这些模型,就像Windows或macOS这样的底层操作系统,为人工智能应用提供了基础平台。

OpenAI的最大成就在于为技术发展指明了方向,极大地减少了其他研究者在探索未知领域时的资源消耗。通过提供开源的训练框架,研究人员和开发者可以在现有的模型基础上进行调整和改进,从而快速构建出自己的大型语言模型。这一过程类似于当前手机操作系统的发展模式,例如,除了华为的鸿蒙系统外,许多其他系统的代码基础都来源于开源的安卓系统。

更直接地说,中国在原创语言大模型方面尚未取得显著成果。诸如文心一言、通义千问等模型,实际上是基于美国开源模型进行训练并本地化的衍生产品。如果将GPT-4的性能定为100分,那么国内的模型可能只能达到六七十分,差距虽然明显,但这些模型仍然具备一定的实用性,可以满足基本需求。

二、国内大模型被芯片卡脖子

对于中国企业而言,构建大型语言模型的主要挑战不在于技术门槛,而在于算力的制约。 算力,简单来说,是指计算机系统或设备执行计算任务的处理能力与效率。在物理世界中,它可以类比为水、电、煤气等能源的消耗。大型语言模型对算力的需求极为巨大,意味着算力越强,训练的质量和效果就越好。

以GPT-4为例,其训练成本约为2150万美元,这是在使用8190个H100 GPU并经过55天的训练后得出的成本估算。如果OpenAI计划推出GPT-5,他们可能需要高达5万张H100显卡。按照每张显卡2.5万美元的价格计算,总成本将达到12至12.5亿美元。

然而,训练大型模型最关键的不仅仅是资金投入,更重要的是高性能的显卡硬件。在这方面,英伟达公司扮演了重要角色。最初,英伟达主要专注于游戏市场,后来发现其研发的AI芯片同样适用于加密货币挖矿、自动驾驶等领域,尤其是在大型语言模型的AI领域表现出色。因此,英伟达开始在这一领域加大投入,不断提高芯片的计算速度,实现了高达1000倍的速度提升。随着公司业务的蓬勃发展,英伟达的股票在一年内暴涨了近450%,几乎垄断了95%的专业芯片市场,公司总市值也飙升至2万亿美元。

英伟达的芯片在人工智能领域拥有三大显著优势:1.卓越的并行处理能力、2.针对深度学习的性能优化,3.以及在多GPU协同作业下实现的极致性能。目前全球范围内,尚无其他竞争者能在短期内匹敌英伟达的技术领先地位。因此,英伟达的H100芯片已经成为了大型语言模型和人工智能领域的事实标准。

根据市场研究公司的报告,截至2023年12月底,各大科技公司对英伟达H100芯片的采购情况如下:谷歌、亚马逊、甲骨文和腾讯各自购买了15万块H100芯片,位列榜首;百度、阿里巴巴和字节跳动分别购买了5万、3万和2万块H100芯片。显然,H100芯片的拥有量在一定程度上反映了企业算力的强大程度。

然而,自2023年12月起,美国政府对英伟达向中国出售高端显卡实施了限制,中国企业只能购买性能相对较低的H20和A800芯片,其性能仅相当于H100的约20%。这一政策无疑对中国的人工智能发展构成了制约,美国企业可以依靠先进的显卡不断提升大型语言模型的性能,而中国企业则在算力方面面临挑战,短期内难以弥补这一差距。

三、中国不缺大模型顶尖人才

此外,从人才和企业数量的角度来看,中国虽然与美国同属于人工智能领域的第一梯队,但在绝对数量上仍存在差距。根据2023年发布的全球最具影响力人工智能学者报告,美国以1079人次的入选学者数量占据全球总数的54.4%,位居首位。紧随其后的是中国,共有280人入选。美国的人工智能学者数量是中国的近四倍。在美国217位顶尖的AI研究员中,有70%来自美国以外的国家,其中来自中国的人数达到了50人,其次是印度和英国。

这表明,中国并不缺乏AI顶尖人才,但大部分人才却在美国发展。再观察全球人工智能企业的格局,中国企业在全球竞争中仍有较大的发展空间。

四、百模大战,资本为王

截至2023年6月底,全球共有3.6万家人工智能企业,竞争日趋激烈。美国以约1.3万家企业领跑,占全球总数的33.6%。中国紧随其后,拥有超过5700家AI企业,约为美国的一半。在融资方面,2023年全球AI初创公司共筹集资金约425亿美元,中国的AI领域投融资数量约为232笔,同比下降了38%,融资总额约为20亿美元,同比下降了70%。整体来看,亚洲和欧洲地区的融资规模都在下降,而美国则保持了14%的同比增长。这一现象表明,资金正日益向顶尖的明星公司集中,而中小初创AI公司则面临更大的融资挑战。随着模型的规模越来越大,资金消耗的速度也在指数级增长,加剧了中小AI公司的生存压力。

以OpenAI为例,在其成立的7年间,通过几轮融资共筹集了140亿美元,并计划未来继续融资7万亿美元,以此重组全球芯片产业链。由于训练大型模型的成本极高,相当于造车或造火箭,OpenAI的每日运营成本高达70万美元,这还不包括公司旗下的其他AI产品。2023年,OpenAI的营收超过了16亿美元,同比增长了56倍,但亏损也在翻番,预计达到5.4亿美元。按照这样的增长速度,等到OpenAI实现盈利时,全球90%的AI公司可能早已不复存在。

目前,绝大多数AI公司完全依赖资本输血,初创公司要么圈钱,要么陪跑,最终能够存活下来的只有少数互联网大厂和屈指可数的头部明星企业。

五、中国人工智能战场

在人工智能领域的上半场,中国企业在算力、人才和融资能力方面已经全面落后于美国。随着马太效应的叠加,这种差距似乎只会越来越大。然而,这并不意味着中国企业没有弯道超车的可能。事实上,回顾中国移动互联网的发展历程,我们可以发现,美国人的优势在于从0到1的创新,而中国人则擅长把1做到100的拓展。因此,中国企业完全有可能在人工智能领域实现弯道超车,只要我们充分发挥自己的优势,抓住机遇,努力创新,就一定能够在人工智能领域取得更大的突破。

全球AI竞赛实际上主要是中美两国的较量,其他国家尚未形成完整的相关产业生态。由于大型模型的开源特性,研发本身并不是主要难点,关键在于如何将AI技术与实际应用场景相结合,实现商业化。

中国拥有庞大的数据资源和消费市场,这为AI技术的发展提供了得天独厚的条件。互联网大厂的核心优势在于其丰富的应用场景,这些场景可以为用户提供实际使用体验,并通过用户的反馈不断进行训练和迭代,推动AI技术的进一步发展。

国内互联网公司在人工智能领域的投入虽然不一,但思路却惊人地一致:利用AI解决自身业务问题。以腾讯为例,去年4月便发布了多模态混元AI大模型,该模型并未像GPT那样广泛消耗算力,而是被应用于腾讯的业务场景,如广告创作、检索和推荐。具体而言,让AI更深入地理解广告内容,然后精准推送至用户手机,这一做法颇具腾讯特色。

混元大模型专注于视觉领域,而阿里巴巴的模型则主打电商销售,字节跳动则聚焦于文字和图像生成。总的来说,只要训练数据充足,通用大模型虽然构建难度较大,但语言模型并不成问题。即便算力有限,时间也能弥补这一不足。

人工智能的上半场已经落下帷幕,而下半场的胜负尚未明朗。尽管美国在算力方面占据优势,但在即将到来的应用层面,中国企业有很大可能性迎头赶上。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 30
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值