算力是数字时代的核心驱动力,高性能算力成为各行业数字化转型的关键要素,需求不断增长。高性能算力在各行业的应用场景越来越广泛,在金融行业能进行复杂金融模型预测,提高投资准确率,在医疗行业能辅助医生进行疾病诊断,提高诊断准确率,而在互联网行业则能处理海量数据,提升推荐算法精准度……

根据《数字中国建设整体布局规划》,到2025年,“数字中国建设要取得重要进展”。数字经济时代,算力是新质生产力典型代表,算力基础设施相当于数字中国的底座。

到底什么是算力?算力包括哪些类别?算力真的得到发展了吗?未来发展向何方?本文将聚焦新质生产力典型代表——算力,进行解读。

一、什么是算力

字面意思,就是计算能力。

更具体的释义就是算力是通过对信息数据进行处理,实现目标结果输出的计算能力

打个比方,人的大脑,就是一个强大的算力引擎。人类每时每刻都在进行着计算,通过口算、心算进行无工具计算。但这样的算力有点低,所以在遇到复杂情况时,会利计算器、算盘等算力工具进行深度计算。

目前50%的传统算力中心并不好用!算力新时代,如何应对爆发式和潮汐式的算力需求?_人工智能

1946年2月,世界上第一台数字式电子计算机ENIAC诞生,标志着人类算力正式进入了数字电子时代。

1981年,世界上第一台PC(IBM5150)诞生,它标志着IT算力不再仅为少数大型企业服务(大型机),而是昂首走向了普通家庭和中小企业。

进入21世纪后,算力再次迎来了巨变。这次巨变的标志,是云计算技术的出现。云计算是分布式计算的新尝试,它的本质是将大量的零散算力资源进行打包、汇聚,实现更高可靠性、更高性能、更低成本的算力。算力云化之后,数据中心成为了算力的主要载体。人类的算力规模,开始新的飞跃。

二、算力的分类

信息化和数字化的不断深入,引发了整个社会强烈的算力需求,云计算和数据中心应运而生。

算力需求有来自消费领域,例如网购、移动互联网等,也有来自行业领域,例如金融、工业制造、教育医疗等,还有来自城市治理,例如智慧城市、城市大脑等。

不同的算力需求和应用,算法不同,对算力特性要求也不同。

算力通常分为通用算力和专用算力。

目前50%的传统算力中心并不好用!算力新时代,如何应对爆发式和潮汐式的算力需求?_人工智能_02

负责输出算力的芯片,就有分为通用芯片和专用芯片。X86这样的CPU处理器芯片,就是通用芯片。它们能完成的算力任务是多样化的,灵活的,但是功耗更高。而专用芯片,主要是指FPGA和ASIC。

在数据中心里,也对算力任务进行了对应划分,分为基础通用计算,以及HPC高性能计算。其中HPC计算,又继续细分为三类:

  • 科学计算类:物理化学、气象环保、生命科学、石油勘探、天文探测等。
  • 工程计算类:计算机辅助工程、计算机辅助制造、电子设计自动化、电磁仿真等。
  • 智能计算类:即人工智能(AI,Artificial Intelligence)计算,包括:机器学习、深度学习、数据分析等。

其中AI人工智能是目前全社会重点关注的发展方向。不管是哪个领域,都在研究人工智能的应用和落地。人工智能的三大核心要素,就是算力、算法和数据。

目前50%的传统算力中心并不好用!算力新时代,如何应对爆发式和潮汐式的算力需求?_基础设施_03

而我们平时看到的数据中心,基本上都属于云计算数据中心。除了基础通用算力、智能算力、超算算力之外,科学界还出现了前沿算力的概念,主要包括量子计算、光子计算等。

目前50%的传统算力中心并不好用!算力新时代,如何应对爆发式和潮汐式的算力需求?_基础设施_04

三、算力发展现状

全球各国的算力规模与经济发展水平,已经呈现出显著的正相关关系。一个国家的算力规模越大,经济发展水平就越高。

伴随着算力相关产业的持续火爆,国内算力中心、数据中心和智算中心的建设热潮也随之涌起。根据国家数据局的数据显示,截至2023年底,全国在用数据中心机架总规模超过810万标准机架,我国算力总规模超230EFLOPS,位居全球第二。

但是,目前50%的传统算力中心并不好用!比如算力利用率问题,以及算力分布均衡性问题。根据IDC的数据显示,企业分散的小算力利用率,目前仅为10%-15%,存在很大的浪费。算力是如此重要的资源,但事实上,我们对算力的利用仍然存在很多问题:

  • 算力分布分散与高效连接难题。随着数字化转型的深入,算力需求日益增长,但算力资源往往分散在不同地区和运营方,如何实现高效连接和统一管理成为一个挑战。
  • 算力异构化程度高,统一管理调度困难。由于算力资源的多样性和异构性,不同类型和规模的计算资源需要不同的管理和调度策略,这增加了算力资源管理的复杂性。
  • 算力交易过程中的信任问题。算力资源归属于不同的运营方,如何建立一个可靠的算力交易平台,确保交易的公平性和安全性,是算力产业发展需要解决的问题。
  • 芯片等基础设施建设的瓶颈。芯片、操作系统、数据库等关键技术是算力基础设施的核心,但目前我国在这些领域仍面临技术瓶颈和外部依赖问题。

四、算力未来

2024年《政府工作报告》提出:适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。

如何推进算力真正转化,满足智能时代千行百业的算力需求?是算力一直需要探讨的问题:

  • 优化算力设施建设布局。按照全国一体化算力网络国家枢纽节点布局,有序建设算力设施,提升算力设施利用效率,促进东西部高效互补和协同联动。
  • 推动算力结构多元配置。结合人工智能产业发展和业务需求,重点在西部算力枢纽及人工智能发展基础较好地区集约化开展智算中心建设,逐步合理提升智能算力占比。
  • 促进边缘算力协同部署。加快边缘算力建设,支撑低时延业务应用,推动“云边端”算力泛在分布、协同发展。
  • 推动算力标准体系建设。加快制定面向业务需求的算力设施、IT 设备、智能运营等方面的基础共性标准,完善相关技术要求、测试方法等,充分发挥标准对产业发展的引领和推动作用。
  • 探索算力协同调度机制。推动以云服务方式整合算力资源,充分发挥云计算资源弹性调度优势,建设可满足各类创新主体开展多元异构算力调度、应用、研发、验证的平台环境。

如何应对算力新时代的算力需求

虚拟化管理平台:实现多元算力统一调度

CNware高算力云底座为算力应用场景、数据应用场景提供底层基础支撑。通过虚拟化管理平台跨芯、跨架构、跨地域,实现多元算力统一调度。敏捷供给智能调度,应对爆发式潮汐式算力,按需调整实例cpu、内存配置,贴合业务资源消耗需求,实现多元算力能够得到更加智能敏捷的供给和调度,能够应对爆发式和潮汐式的算力需求。

高算力云底座:提升计算效率与性能

CNware高算力云底座利用NUMA感知技术、内存分配策略等手段,提升计算效率。虚拟机vNUMA技术则能够减少内存资源碎片,最大化发挥硬件算力性能,提升虚拟机的密度。支持GPU设备的直通,或者切分为vGPU(SR-IOV)的方式直通给虚拟机,这能够提升浮点计算、图形加速等场景的性能。同时借助V-Turbo优化,能够发挥多核芯片的优势,提升虚拟机的计算性能容量和虚拟机密度,特别适合于基于ARM多核架构进行深度优化的场景,满足业务资源消耗需求并最大化发挥硬件算力性能。

以算力为核心的新基础设施建设加速推进,算力正在成为一种新型生产力。与此同时,计算产业也在不断创新和演变,产业生态格局日益复杂和多元。

参考文献:

1.《中国算力发展指数白皮书》,信通院

2.《算力网络技术白皮书》,中国移动

3.《算力网络(CAN、CFN、CPN)、东数西算是怎么回事》,QianLing,知乎

4.《中国联通算力网络白皮书》,中国联通

5.《算力网络发展介绍与展望》,曹畅