摘 要
当前算力需求爆发式增长,通用计算也朝着人工智能计算的方向演进,新型智算中心网络作为算力间数据交互的中心,成为影响算力性能发挥的关键。分析了智算中心对网络的需求,对网络协议、架构和运维管理等方面进行了深入研究,并结合业界发展情况,给出了智算中心组网方案的建议。
0 1
智算中心的重要性及组网挑战
算力是数字经济时代的核心生产力,是推动经济发展的新引擎。随着元宇宙、ChatGPT等业务的兴起,语言处理、机器视觉、自动驾驶等多个领域借助强大的数据计算能力,取得了长足的发展。相较于传统云计算、超算中心,智算中心更能满足日益丰富的人工智能算力需求,未来80%的场景所使用的算力资源都将由智算中心承载[1]。而参数量巨大的AI模型,对智能算力的需求飞速提升,根据IDC评估报告,预计2021年—2026年,中国智能算力规模年复合增长率达52.3%[2]。例如,目前L2级别的自动驾驶通常需要数百TOPS的算力,但要想真正实现L4/L5级别的自动驾驶,至少需要20 000+TOPS的算力。
受制于芯片材料、工艺、成本等因素,算力的增长速度逐渐放缓[3],与算力需求存在极大差异,这也推动了芯片