趋动科技携手麒麟软件打造基于银河麒麟操作系统的异构算力池化解决方案,共同探索AI领域新场景。

人工智能技术作为数字经济发展的重要推手,在各行业业务场景中落地需要大量AI算力资源的有效保障。在IT基础设施普遍云化的今天,AI算力一方面需要通过软件定义的方式完成算力池化,实现资源敏捷交付和灵活调度,简化运维;另一方面,也需要满足来自政策和信息安全的安全创新转型要求。

趋动科技OrionX AI算力池化软件通过软件定义异构算力,将物理异构算力硬件资源进行池化管理,使应用与物理硬件资源解耦合,实现跨厂商异构算力资源精细化管理和灵活调度

方案优势

• 结合银河麒麟高级服务器操作系统V10提供的内生本质安全、云原生支持、自主平台深入优化、高性能、易管理等特性,产品层面适应算力资源池技术框架,提升了系统的整体管理、运维、支撑能力。

• AI算力资源集中管理,AI任务根据资源池内算力资源使用情况统一调度。AI算力资源声明式申请,资源自动聚合满足单机单卡,单机多卡及多机多卡不同场景要求。

• 硬件资源与AI应用松耦合,CPU算力与AI算力按需配比,AI算力资源可按需调用,随需应变,支持显存扩展、算力超分。

• 自定义AI算力监控规则及监控数据可视化,支持AI算力数据分析及统计报表。

应用案例

由华夏银行首先提出,与金融信创生态实验室及有关产业机构历经4个多月的技术攻关和测试,验证该方案符合预期。

该方案基础设施层涵盖信创服务器+异构算力芯片,包含英伟达GPU、中科海光DCU以及寒武纪MLU异构芯片;操作系统层使用信创麒麟OS;虚拟化层采用趋动科技GPU异构池化软件。

解决方案上新了丨趋动科技推出基于银河麒麟操作系统的异构算力池化解决方案_人工智能

OrionX将不同的异构算力芯片统一纳管和资源池化,支持资源的切分、远程调用、动态挂载释放等功能,为上层的算法框架提供任意需要的资源:如TensorFlow需要GPU的资源,则可为其动态分配英伟达GPU资源;PaddlePaddle若需要海光DCU的资源,则为其动态分配DCU的资源。

通过异构GPU资源池的能力,方案可实现对不同厂商不同型号的异构算力资源统一纳管、统一分配、统一监控;并通过对异构算力的灵活调度和动态分配,实现异构算力的合理规划,提升资源利用率的同时实现经济效益。

该解决方案在麒麟软件2023优秀生态解决方案大赛中荣获“卓越创新奖”,主要应用于人工智能开发、训练、推理场景,可实现GPU算力资源利用率的优化提升,已在能源、金融、运营商、互联网、新能源车企等诸多行业中产生大量的应用案例。

解决方案上新了丨趋动科技推出基于银河麒麟操作系统的异构算力池化解决方案_人工智能_02

关于合作伙伴

麒麟软件主要面向通用和专用领域打造安全创新操作系统产品和相应解决方案,以安全可信操作系统技术为核心,现已形成银河麒麟服务器操作系统、桌面操作系统、嵌入式操作系统、麒麟云、操作系统增值产品为代表的产品线。旗下产品已全面应用于党政、金融、交通、通信、能源、教育等重点行业,服务用户覆盖所有的中央部委、政府机关、地市党委。根据赛迪顾问统计,麒麟软件旗下操作系统产品,连续11年位列中国Linux市场占有率第一名。