GPU是大模型牌桌上唯一的砝码吗?
——或许全世界都或多或少想摆脱英伟达这个过于强势的硬件供应商。然而,对于被“卡脖子”的我们来说,这个问题则更加的现实和严峻。
美方对我国AI发展的限制是可谓是全方位的。用中国科学院计算技术研究所研究员张云泉的话说,这包括“禁止销售高端GPU,终止大模型源代码分享以及中断生态合作。”
这使得硅谷“暴力美学”式的Scale Law我们很难跟进。
在近日召开的2024中国算力发展专家研讨会上,专家们指出了一条新的路:超算。
“当大模型需要1万至10万个GPU时,通过开发专用超级计算机克服高能耗、可靠性问题和并行处理限制是至关重要的”张云泉说。
1.超智融合:英伟达验证过的算力路
很多专家看好超级计算和智能计算的整合。这将有希望同时满足多种不同算力的应用需求。
英伟达新推出的最强芯片GB200就是这个思路,该芯片由两个B200 Blackwell GPU和一个基于Arm的Grace CPU组成。通过NVIDIA先进的 NVLink-C2C互连技术,CPU和GPU之间可以紧密协同,以减少数据在两者之间的传输时间,提高处理速度。
图片
不过,这还不是一个完美的解法。中国科学院院士陈润生说:这种架构并没有从根本上解决效率问题。“超算与智算的结合是必然的,将会有机融合,而不是简单地把它们凑在一起”。
2.堆芯片或将过时:思路由硅基向碳基转变
院士钱德沛不主张“跟着美国走”。堆芯片在