随着数据中心基础设施规模的持续增长,设备运行风险缺乏有效数据辅助监测与管理等问题日渐凸显。对此,邮储银行提出了一种基于数据挖掘的网络设备风险评估方式,通过建立设备运行风险评估模型,提前分析设备健康状况和维护需求,预测设备老化风险并制定科学合理的维护计划,从而进一步提高数据中心网络设备整体服务能力。
近年来,邮储银行业务量持续增长,IT架构转型加速推进,数据中心的基础设施规模也随之不断扩大。然而,网络基础设施资源的长期运行同样也带来了复杂性、不确定性、维护难度、维护成本等诸多问题,尤其是老旧设备运行风险缺乏有效数据作为研判依据。为改善上述情况,邮储银行基于大量的静态设备信息数据、动态线上配置数据、线上运行数据以及运维数据,通过从静态和动态两方面进行统计分析,建立设备预测性维护模型,有效提高了设备的整体可靠性和稳定性,在降低维护成本和运行风险的同时,助力信息系统业务连续性水平跨上新的台阶,进一步增强了银行的核心竞争力。
一、网络设备维护难题和挑战
在传统的数据中心网络硬件基础设施运维过程中,通常是基于人工操作和运维经验来判断是否需要进行设备更新维护。这种方式虽然能够发现问题并及时处理,但整体效率较低,且容易出现漏检和误判的情况。尤其是随着设备数量和类型的不断增加,网络硬件基础设施维护及更新替换正面临新的更大挑战:
一是数据质量挑战。网络设备的运行和巡检信息不仅数据量庞大,而且具有多元化的特点,需要耗费大量时间进行人工分析和判断,同时相关结论的准确性和可靠性也难以保障。二是维护流程复杂。网络设备维护通常需要多人乃至跨部门合作,这不仅增加了制定设备更新、替换策略的复杂性,决策的时效性