日前,由国际权威研究机构高德纳(Gartner)所制定的《2023年中国ICT技术成熟度曲线(Hype Cycle for ICT in China,2023)》报告出炉,其中,浪潮信息入围“中国智能运维(AIOps in China)标杆厂商”,浪潮信息在智能运维(AIOps)技术方面的专业实力获得了高度认可。
资料显示,自2016年Gartner首次将AIOps纳入中国ICT技术成熟度曲线,AIOps已被业界各大厂商广泛接纳。浪潮信息是此次唯一入选标杆厂商的服务器企业,这也是中国市场对浪潮信息AIOps能力的深度认可。
浪潮信息InManage,数据中心基础设施的360°智能管家
不久前,浪潮信息发布了全新一代G7服务器,性能、可靠性和易维护性都有了进一步的提升。浪潮信息还进一步升级了数据中心基础设施管理平台InManage,产品综合能力大幅提升的同时,重点增强了其AIOps(智能运维)能力,帮助企业用户统一、智能化管理服务器、存储、网络等IT基础设施,提高运维效率、降低运维成本,保障数据中心稳定的运行。
针对用户多地数据中心设备种类多,统一管理难度大的挑战,InManage通过“一中心多网格”的分布式设计,突破了海量IT基础设施智能化监控告警的难题,能够纳管多达400多种机型,支持超过10万台IT设备的统一智能化管理,是业界领先的ITIM(IT基础设施管控)平台。
在智能化管理方面,针对数据中心服务器运行过程中存在的CPU、内存、硬盘等关键部件故障预测失效、监控失准、告警失稳的难题,InManage依托自研的面向基础设施的AIOps平台,拥有自动化数据处理、特征衍生、自动化建模工具多项创新能力,有效解决局部硬件概率性故障下系统有效容错的问题。
(1)基于服务器日志的智能故障根因定位技术
InManage实现了对海量服务器带内、带外日志的稳定采集,提出了基于服务器部件告警日志,通过智能故障诊断 AI 模型,推理出服务器故障根因的整体解决方案,故障诊断精准度超过95%,远高于业界平均标准。
(2)硬盘故障主动预测技术
InManage通过硬盘特征数据分布式采集和存取技术,实现了线上生产系统10万级硬盘 特征数据的高质量采集,通过决策树选择、剪枝策略对随机森林算法进行改进,构建面向业务场景的硬盘故障预测模型,准确率超过95%。
(3)内存故障预测技术
InManage利用设备检查异常检测机制,完成物理内存故障精准位置的抓取,实现故障内存物理位置向量化,基于向量化特征构建内存特征关联关系模型,对内存健康状况有效进行实时预测性分析,与基于阈值预测方式相比准确率提升约30%。
针对基础设施自动化过程中存在运维工具离散化,与业务场景切合度不高以及升级、配置、部署等流程复杂低效的难题, InManage在自动化运维管理方面,秉承“软件定义基础设施”产品理念,为用户提供可定义、自编排的服务器自动化能力,覆盖从固件升级到业务上线再到设备下架的全生命周期自动化运维场景。在某客户数据中心近4000台服务器上架工作中,通过浪潮信息InManage平台,帮助用户将部署周期从原来预计的几十天缩短至7天,运维效率提升450%以上,保障数据中心运维效率。
凭借极致运维的优势,浪潮信息InManage赢得了客户的广泛认可,目前已相继在互联网、金融、通信、IT、教科研等领域得到了充分投放,在保障数据中心业务安全、稳定运行的过程中,浪潮信息InManage正发挥着越来越重要的作用。