金融行业信创架构下典型的运维方案设计探讨和参考

点击标题下「蓝色微信名」可快速关注

技术社群的这篇文章《金融行业信创架构下典型的运维方案设计》给我们讲解了信创背景下运维方案的设计,信创架构和传统相比,还是有些不同的,相应的运维方案,需要一定改造,才能更好适应这些场景的需求。

信创是“信息技术应用创新”的简称,其产业主要包括新一代信息技术下的云计算、软件(操作系统、中间件、数据库、各类应用软件)、硬件(GPU/CPU、主机、各类终端)、安全(网络安全)等领域,涵盖了从IT底层基础软硬件到上层应用软件的全产业链的安全可控、自主创新等重要领域。

进入数字化时代以来,企业正在不断加大软硬件投入,以强化自身的数字化能力。而在信创政策驱动需求下,企业一般采用全栈信创的方案完成新建或改造系统IT基础环境的建设,从而衍生出了信创背景下的IT基础架构运维需求。目前软硬件原厂商为企业提供一定的基础运维,从企业运营角度看,并不能满足其自身的业务稳定性需要,所以提升运维能力是数字化时代企业进行转型和发展必然需求。

金融业作为当前IT建设和应用的标杆行业,其IT运维水平和能力也是最高的,在行业监管政策要求下,信创应用不断落地,如果沿用传统架构运维思路和产品将难以满足信创应用对运维迫切需求。

一、信创架构下典型的运维方案设计

为确保信息化应用的可用性和连续性,构建以信息安全保障和系统运行保障为基础的规范化运维服务保障体系,建立运维管理机制,明确以事件管理、问题管理等环节为基础的运维服务流程。分析发生在生产运行环境的事件,确定最常发生或具有最大影响的事件,找出根本原因,通过预防性措施来防止事件的再次发生,保障系统、网络、业务运行的稳定性。

银行的IT系统包含有业务系统、管理系统、办公系统三类。目前,我司办公系统(OA、邮件)完成了信创改造。但由于产品及兼容性问题无法与现有的运维及监控管理平台对接,造成了现有信创系统采用手工方式监控管理,缺乏集中统一的主动式监控报警,故障预警能力差,不能全面反映系统运行的性能状况及提前发现系统的潜在隐患。

信创系统运维工作占用了较多的人力资源,由于缺乏有效的服务流程工具,需要较多的运维人员才能完成对关键信息系统的运行监控和维护操作,运维人员的数量会随着信息系统的增加而不断增加。要改变这种局面,需要梳理整个运维工作流程,建立一个服务流程平台,实现运行监控、系统维护和系统建设三个环节的人员分离,减少人力资源占用。同时,在故障管理、问题管理、配置管理流程控制方面虽有制度但缺乏相应刚性约束。

独立的运行态势分析,缺乏关联和整体性。由于信创应用系统独立运行、维护和管理,所以与传统系统的运行态势分析和审计也是相互独立的,不但各个系统会单独分析,即使同一系统中的每个网络设备,每个主机系统及每个数据库系统都要分别进行分析,缺乏集中统一的系统分析。同时在故障发生后,缺乏对故障进行跟踪记录分析以提供解决故障的准确依据。

通过对信创架构下运维需求分析,产品选型设计需要遵循如下原则和运维管理制度机制。

• 开放性原则:遵循各类标准化协议与规范,通过丰富的适配器满足各种国产网络设备、服务器、存储设备、操作系统、数据库、中间件、业务应用系统等多样性需求。

• 可扩展、易集成原则:能适应不断发展的业务需求。实现具备高度集成性,可以和第三方产品(其他系统监控软硬件互联或接入本系统进行监控提供接口)进行集成,进行功能扩展,方便统一管理。

• 兼容性:持续跟进国产各品牌设备型号的升级适配,全面保障系统稳定可靠运行。实现一体化多级管控、集中告警、运维管理。

建立相应的运维管理应急机制:突发事件应急策略是对中断或严重影响业务的故障、宕机、数据丢失等进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。在系统维护过程中,突发事件的出现是很难完全避免的,针对这种情况,我们设计了完善的突发事件应急策略:定期规范检查各硬件设备的运转情况和应用软件运行情况,同时根据现场环境,建立合理的数据备份和恢复方案,做好日常的数据增量备份和定期全备份,确保备份数据的完整性、有效性、正确性。当出现比较严重的故障,数据被破坏时,根据数据恢复方案,采取数据备份恢复的措施,保证数据的正确恢复。

二、信创架构和传统架构运维不同之处

1)信创整个生态还不够成熟,软硬件适配工作尤为重要,尤其是在产品自身运行维护上还是依赖厂商或者服务商在信创领域的经验,不同的产品组合需要有厂商的互认证或成熟部署案例来最大限度地消除适配存在的隐患;

2)信创项目的软硬件产品比传统IT项目中的软硬件产品在性能上还存在一定差距,需要尽可能根据实际工作需求配置性能最优的产品,提升最终用户的使用体验;

3)信创技术正在迅速发展之中,产品更新较快,要保证系统稳定、有序、持续地运行和升级,就必须严格控制产品版本。建议根据信创项目特点,建立版本控制体系,对于已适配的产品组合,严格控制其组件的版本。

总之,信创项目涉及的产品较多,集成复杂度高,在项目实施前应对项目风险点进行充分的评估,在人员、制度、技术以及资源等多方面不断改善和优化运维体系,保障运维工作的稳定有序,提高运维效率。

综上所述,随着信创的发展,迫切需要一个统一的IT运维系统能为各应用系统、各种硬件基础设施等提供一个综合的运维管理平台,实现集中的、实时的、可视化的、智能化的业务运行监控管理和服务流程平台,以便即时了解IT系统整体运行状况,及时发现存在的隐患、风险以及瓶颈所在,从而做出快速响应,确保各项业务的持续稳定运作。实现日常运维管理工作的标准化、规范化、流程化和制度化,全面提升整体运维管理水平。为此需要注意以下几个方面:

加强运维意识:树立运维团队的责任意识,风险意识。统一思想,提高运维职业素养,加强责任心,培养良好运维习惯,激励运维团队的主动性是首要任务。

预防为主:通过主动性运维工作减少事件发生概率,把大多数工作逐步纳入常规、计划性日常工作管理范畴,主要内容包括但不限于容量评估、性能分析、定期维护、例行重启、健康检查、备份策略、高可用评估加固、系统运行基线建立、问题管理、应急演练等工作。

及时发现:尽早及时发现系统异常现象,并及时通知报告到相关人员。主要工作内容是不断加强监控覆盖面,加强监控自动化手段,加强监控发现的有效性、及时性、正确性,持续改进。优化发现报告流程。

高效处置:提高事件处理能力,具备快速恢复生产服务能力。主要工作包括但不局限于建立优化事件处理流程、技术技能交流、知识积累经验共享、完善应急预案,提高决策质量效率、问题定位解决方法、事件解决手段,解决有效沟通和技术支持体系等。

合规操作:控制风险,有效避免、减少、控制操作风险、减少和规避各类人为事件。主要内容包括但不局限于日常安全操作要求、相关制度、规范;上线、变更、演练、验证相关的实施控制要求;运维人员安全风险意识的建立、培养;日常工作习惯要求;建立、贯彻操作、审批、实施流程等。

如果您认为这篇文章有些帮助,还请不吝点下文章末尾的"点赞"和"在看",或者直接转发朋友圈,

7fc736aa9d7d56fe7e75948954e4df34.png

近期更新的文章:

新型运维体系如何建设?

基于业务可用性管理,金融企业如何建立监控管理体系?

IT资产数字化管理2.0

MySQL中Index column size too large错误场景

Ali的MySQL建表强制规范

热文鉴赏:

中国队“自己的”世界杯

你不知道的C罗-Siu庆祝动作

架构设计的15个关键概念

大阪环球影城避坑指南和功略

推荐一篇Oracle RAC Cache Fusion的经典论文

"红警"游戏开源代码带给我们的震撼

文章分类和索引:

公众号1500篇文章分类和索引

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值