群"模"大战: WAIC 2023世界人工智能大会参展有感

2023年的WAIC大会上,生成式大模型成为焦点,众多公司展示了自家大模型,如阿里云的通义、华为的盘古等,但重量级应用尚未普及。模型驱动的AI开发和MaaS服务崭露头角,AI芯片和硬件也在不断发展,如华为昇腾在训练和推理加速上的应用。虚拟人技术显著进步,3D虚拟人效果接近真人,而机器人和无人机展示出潜在的应用前景。尽管VR行业似乎进入调整期,但大模型的未来应用充满期待。
摘要由CSDN通过智能技术生成

作为连续参加了两届WAIC的“幸运儿”,两届直接对比是最容易看清行业趋势的。2022年的主题是元宇宙,“元生无界”,但因为众所周知的原因,参展观众和厂商并不多。 而2023年生成式大模型红得发紫,AI又有重大突破,展会的主题亦非常贴切:“智联世界,生成未来”。

6b7fd6bce4e00a90d6b1143124bfc757.png

本次大会展区面积大了一倍,设有两个场馆,同时增加了大量AI相关的创投,金融和行业应用等共计133场主题论坛,增加了大量新公司新面孔, 即使是在周五工作日,也拥有堪比北京车展的人流量和热度。

ec1a7809cb7ead6f0c64421cca20be81.png

本次展会,生成式大模型是绝对的主角。发布大模型的厂商有三十多家,本文也一分为二,GPT & others。others包括训练推理硬件,无人机,行业应用等领域。

GPT大模型:群模大战

笔者参加了阿里云冠名的大模型行业论坛, 某一嘉宾的观点是:以chatGPT的出现为分水岭, 之前是AI时代1.0,模型解决单一任务,开发周期长投入高。 现在进入了AI 2.0时代,一个模型能解决多个,甚至没有见过的新问题(涌现),也是AI赋能千行百业的iphone时刻。

f2d99de55cf099526931460e7212a612.png

本次参展笔者有三个感受,总结如下:

1. 大模型百家争鸣,但重量级应用尚未出现

首先是大模型发布数量极多,包括盘古(华为),商量(商汤),文心一言(百度),混元(腾讯)等等,百花齐放。

这里包括阿里的通义大模型,通义千问是问答机器人,而通义听悟有现场体验,开会神器,一键导出区分发言人的文字稿。

c71aee05aa392deb2fce38c2fa110ab1.png


百度的重点是其AI全栈布局,包括去年也是主角的文心大模型(文心一言,文心一格),还重点介绍了将芯片部门拆分独立融资的AI昆仑芯。 

3af6cb4dcbd4fb9b31a0a9319229566a.png商汤的商量(SenseChat)大模型,这个是可以现场体验的,很想和工作人员仔细聊聊技术,但奈何实在是挤不进去,里里外外全是人。

42dc16c10d76769fadb0fb09fa97c993.png

AIGC今年则是遍地开花,比如商汤的秒画,去年可能只有百度的文心展示了这功能。  

9205b27d457df0eb90f488da6a048f25.png

Together公司在展会的分论坛上发布了其7B大模型:RedPajama-7B,开源可商用,效果比LLaMA-7B和Falcon-7B效果更好。

f200226b4f005066743ea78d46a0b536.png

大量企业都希望能通过大模型,深度赋能行业。但生成式大模型目前还是以聊天对话为主。

在展区,笔者只看到了华为的盘古大模型应用在B端行业,如矿业,铁路,政务等等,“不做诗,只做事”。盘古气象大模型在Nature上发表了《三维神经网络用于精准中期全球天气预报》,通过适应地球坐标系统的3D Earth-Specific Transformer能够提供秒级全球气象预报。但其具体实现架构则没有在展会公开。

00f2766e94473e4a43a699bfabfec0f5.png

除此之外,笔者暂时没看到其他大模型拳头应用。大家都在讲科普和规划,但缺少真实落地场景。我们设计了一个发动机,但把它装进车里肯定只是时间问题。

ebd2049971ded90c289e9408efa624fe.png

目前很接近2012年3G移动互联网刚刚兴起, 当时有人觉得3G用起来足够,没想到4G带来了极其繁荣的移动互联网发展。展会上大模型创新创业的大赛和点子特别多,虽然真实商业落地虽少,和GPT3.5也有距离。但可以预见,大模型一定能带来下一步的行业大红利。

2. 模型驱动的AI开发:MaaS会大放异彩

a5972bc619dbd64d0470a8730f7a95b3.png

阿里大模型除了展现其“大”之外,就重点强调MaaS(Model as a Service)的研发模式。以笔者粗浅的理解,由于自然语言冗长且不准确,大模型在工业界的落地方式肯定不是对话聊天。大模型的通用性很强,通过将模型的高级能力封装成一个个的函数,再让大模型去自动生成调用这些函数的函数,并让大模型生成测试任务来自动化回归。 这样既满足了可控性,又大大提升了研发的效率。AI从手工作坊进入工厂车间。

基于以上思路,在展会上阿里推出了模型库modelscope(魔搭,正好和达摩反过来,开源了十来个百亿参数大模型), 和DashScope灵积模型服务平台, 通过API的方式进行调用。和OpenAI的 LangChain有一定相似之处:

0381634724e9e337371ec86b8ffef445.png

目前现有的思维链(COT)解决复杂问题的案例并不多, 例如让通用大模型跟人下象棋,因为游戏规则难以表达,状态太多, 还是很困难的。但可见的未来,这些问题一定会被解决。

3. 大模型时代,可信AI变得更加重要

企业担心大模型导致的数据泄露和合规问题,上班族担心大模型替代工作,甚至变成T-800。因此可信AI变得非常重要,成为行业关注的重点。

例如蚂蚁集团今年宣传的重点,从隐语变成了大模型可信度分析(蚁鉴,今年的镇馆之宝之一)。和工作人员讨论后, 并不是大模型来校验大模型,而是用大模型生成攻击训练语料,再用普通文本分类模型来做多分类。

a29af2762758638321359440b0e9071b.png

同时信通院、清华大学、蚂蚁集团等多家单位共同发布了《可信AI技术和应用进展白皮书(2023)》:

e736e8fb7b9858cc13da092993897d81.png

蚂蚁在安全和风控领域进行了大量的投入。 支小宝也开发了基于生成式AI的2.0版本。  而绿色计算,TuGraph大规模图计算系统, OceanBase这些往年的常客自然不在话下。 蚂蚁还是很细致地准备了很多互动, 点赞。

其他:虚拟人/硬件/无人机/VR

大模型时代,训练和推理卡是最重要的生产资料,算力是王道,先说这个。

训练和推理加速

展位最大,出现次数最多的是华为昇腾,据说已经应用在国产的近一半的大模型创新上,已有集群规模已经达到万张。比如下面是基于昇腾芯片的宝德自强AI训练服务器:

d48ae58c97534bc2bf2fdbf97cdfa2f0.png

除此之外,本次展览还有AI芯片公司燧原科技, 登临科技,和大量的板卡和集群服务商。 直接将AI芯片和安防视频处理集成在一个盒子里,实现边缘计算:  

62e36b1df6f2528873cf198b3ffc0e30.png

不过稍显不足的是,整个行业的芯片算力相比去年没有显著提升。很多芯片和产品都是去年出现过的,比如这颗阿里云的含光800:

1e5ee956f5f4e41e6b39b31039c9f6ef.png

让笔者耳目一新的是的墨芯科技的稀疏推理技术,按照工作人员的说法,可以提升6倍推理速度,功耗减半。 其原理就是矩阵运算中,大量0元素和无效元素进行删除(可能和GroupLasso很像),但需要使用他们的软件框架Moffett NNKit。 墨芯坚信“稀疏化才是未来”。  这里的难点是,现有的GPU硬件是很难实现高倍率稀疏化的, 笔者很好奇其效果如何和实现的细节。

507c626ced873ff758192304eb3c1fbb.png

笔者认真参观了每一个推理硬件展台,和不少工作人员讨论了我国自研和NVIDIA有多大的差距,基本结论是“NVIDIA占据了95%以上的AI计算市场份额, 自研芯片能用且用起来了,但和A100,H100这种级别相比,制程和设计能力相差较远”, 而且也没有CUDA这样的软件生态,基本上是自研的SDK,但未形成业界影响力和标准。”

虚拟人效果比肩真人

展会上除了可以以假乱真的2D虚拟人外,更多的是3D虚拟人,除了有一点感官上不自然之外,效果真是突飞猛进。日常教学和直播带货绝对没问题。 

6480b0010edd19627241419815795102.png

腾讯云发布了“智能小样本数智人”, 24小时制作数字智能人。

5a6e3618851ba6aa54f87776c71f004e.png

机器人和无人机

特斯拉把擎天柱人型机器人搬到了现场。达闼科技的云智能机器人跳了《隐形的翅膀》:

33f49a930195141f2f35f338521de05a.png

但机器人感觉暂时没有享受到大模型的红利,我们几个观众在它面前嘘寒问暖,但人机交互上依然很蠢萌。


美团无人机去年没有参展,不过这才是黑科技。六轴飞行器,可负载5公斤,电池续航可飞行五公里来回。并提供从飞控,到管理系统的一整套解决方案。但问及单次飞行的成本时,工作人员无可奉告,估计短期内送30元的打工仔外卖是不可能了。

7c0c521845c4ec0181aa3c8732ffd32f.png


语音识别和合成已经达到了非常准确的程度。手术和日常门诊,医生口述即可一键生成病历,demo上还是非常厉害的。自动驾驶方面,除了整车展示,还有很多激光摄像头和集成解决方案的展示。因为篇幅问题不再展开。

最后


整个看下来,笔者收获非常大, 也非常感慨。

首先,大模型百花齐放,但是怎么提升国产自研大算力AI芯片的竞争力是关键。 本身模型架构和数据都不再成为瓶颈时,算力和GPU生态就成为最大的制约。期待国产AI芯片能像SSD存储那样,颠覆整个产业界; 其次,相比于去年的红火,整个VR行业似乎进入了阶段性调整期,本次展会,头显和vr成了排队游玩的玩具,一帮孩子们排成长队; 最后,我们还处在大模型革命的前夜,明年WAIC,一定会有更多的革命性创新和落地,一起期待!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值