目录
摘要
在“东数西算”工程背景下,算力基础设施迎来了飞速发展,产生了大量异构算力资源。云—边—端的算力与网络协同,能够满足多种异构算力资源与众多应用场景的高效匹配。基于异构算力网络调度展开研究,为异构算力网络融合调度技术提供研究思路,系统性地分析了技术发展现状、算力网络融合调度关键技术与挑战,提出了众多应用场景。但实际应用中异构算力网络调度更为复杂,仍面临许多不确定性挑战,需要不断完善。
关键词: 异构算力; 算力网络; 高效调度; 算力应用
0 引言
目前,数据处理对于算力的需求日益剧增,数据中心或终端设备已无法满足业务对算力的需求。通过协调广泛的云—边—端的算力与网络来满足日益增长的数据处理需求,成为算力网络协同发展的方向。借助算力网络来调度和纳管异构计算能力,构建云—边—端一体化的异构数据算力网络调度机制,更好地满足涵盖大部分场景的需要,如边缘计算、人工智能以及高性能计算。
1 算力网络调度内涵
在5G技术到来之前,大规模的算力应用集中出现在单点设备上[1]。一些具体的应用场景对数据中心的并发计算能力、网络吞吐量能力、存储能力提出了特定的要求[2]。随着5G、大数据、人工智能等新技术的发展,海量数据逐渐扩散到网络边缘[3],加速了算力从数据中心向网络边缘转移,甚至向终端设备扩散。
算力网络是一种根据业务场景需求,在云—边—端之间按需调度算力、网络和存储资源的新型信息基础设施。企业客户或者个人用户通过算力网络,灵活地进行算力调度。同时超级计算中心、人工智能计算中心、通用数据中心等都已融入算力网络,算力与网络正走向融合。
实现算力网络调度的重点在于算力调度与运营的结合,对用户的各种需求匹配合适的资源,根据不同业务场景对多样性算力资源进行自动的需求匹配和调度。同时,算力网络调度的场景和范围比较广泛,需要在多云之间、云和数据中心之间、云网之间进行协同,在跨行业、跨地区、跨层级等复杂场景中进行调度。
2 异构算力网络发展现状
2.1 异构算力发展奠定了算力网络调度的基础
近年来,由于边缘计算等新型计算业态的出现,数据中心的资源部署已经从传统的集中式中心云的模式,逐渐演变为云与边缘计算协同调度的模式。未来移动互联网的发展,将逐步推动包括终端在内的泛在计算与之协同发展。
以云—边—端为主的新型算力资源的协调发展,使得泛在计算构建了不同层级的算力结构,算力架构已经从通用架构转向了专门定制。异构算力融合了中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)等多种芯片,可以满足不同类型、不同场景的算力需求。CPU作为通用芯片使用和部署,广泛应用于服务器和嵌入式终端;GPU多用于快速矢量图形数据处理;FPGA是一种可编程逻辑芯片,常用于逻辑控制方面;ASIC用于具体场景的处理。在市场需求的驱动下,算力的发展呈现多样性,打破传统单一架构的算力形态,从而实现异构算力协同以应对不同场景下的数据处理。