原文《企业统一智能IT监控与运维管理平台建设方案》PPT格式。
IT监控运维现状及痛点
IT监控运维解决方案
总体思路
总体思路
解决方案·构建智能化IT监控平台,建立主动式IT监控运维模式
解决方案·构建智能化IT监控平台,建立主动式IT监控运维模式
构建主动式IT监控运维模式的核心思路与方法
构建主动式IT监控运维模式的核心思路与方法
基于统一平台,打造一体化监控运维体系,全面提升运维能力
基于统一平台,打造一体化监控运维体系,全面提升运维能力
精细化的监控是主动并全面识别、预防、处理各类故障的基础
-
对IT系统所包含的对象、资源与内容进行细致的分层与分类
-
全面连接、监控各类IT资源与内容,全面采集数据
-
不同类型资源使用不同的监控与管理工具
-
通过精细化的数据采集,实现对It系统的多维度、全面监控与运维
精细化的监控是主动并全面识别、预防、处理各类故障的基础
细致的结构化内容分层,是实现精细化IT监控的前提
细致的结构化内容分层,是实现精细化IT监控的前提
在精细化基础上从多个维度监控系统,保障业务的可用与连续
在精细化基础上从多个维度监控系统,保障业务的可用与连续
智能化的监控分析,识别故障并预测风险,构建主动运维能力
智能化的监控分析,识别故障并预测风险,构建主动运维能力
标准化程度、故障模型与算法设计的合理性直接决定项目成效
标准化程度、故障模型与算法设计的合理性直接决定项目成效
建立标准、细致的IT监控指标库,实现一体化、精细化IT监控
建立标准、细致的IT监控指标库,实现一体化、精细化IT监控
主动的故障探测与自动的故障修复,极大提升效率并降低风险
平台在全面采集系统各项运行数据后,进行智能化的分析,可以及时识别出各类故障和故障风险,基于此平台会进一步采取自主化的处理方式,及时修复故障,提前解除风险,以保障业务的可用性和连续性。
-
平台会主动对系统进行各项指标的探测和巡检,以便及时发现系统故障
-
平台会基于智能化数据风险,给出故障风险预测提前判断潜在的故障,并进行主动干预,降低系统运行风险
-
任何故障或风险信息,平台都会及时给予告警(支持邮件、短信、信息、声音、警灯等方式),通知相关人员
-
平台支持对(部分)故障进行自动的修复处理
-
平台支持自动执行系统部署图文
主动的故障探测与自动的故障修复,极大提升效率并降低风险
自主化IT监控与运维总体流程
平台具备了自主化IT监控与运维能力,不仅可以进行主动的伤探检测,还可以在发现故障或潜在故障风险后,进行主动的故障修复处理,实现整个IT故障检测与处理的全自动化。
自主化IT监控与运维总体流程
主动式的IT故障探测与系统状态巡检,保障业务的可用性
可以利用自动化测试脚本,命令执行,调用接口、模拟操作等方式,主动对IT的各项资源以及业务系统的运行状况进检测,主动发现存在的故障与潜在风险,改变被动等待故障发生的IT监控运维工作模式,保证业务的可用性。
主动式的IT故障探测与系统状态巡检,保障业务的可用性
统一的告警策略配置,自动化监控告警,集中历史事件管理
可以在平台上配置统一的事件告警策略,包括:告警事情、告警内容、告警方式与告警联系人。平台在监控过程中,一旦发现符合告警策略的事件,即会自动发出告警,并将告警事件进行统一管理与分析。
-
可以定义不同事件/风险的等级,然后根据事件/风险等级,设置不同的告警策略
-
可以定义事件的告警方式,告警联系人员范围,告警内容等
-
可以集中配置、更新、管理告警策略
统一的告警策略配置,自动化监控告警,集中历史事件管理
实现自动化IT运维,简化IT运维工作,提高运维效率
利用平台的自动化运维工具,可以将传统枯燥、重复的运维工作逐渐用机器自动化代替,例如磁盘自动清理据、数据定时备份、定期服务重启、应用自动部署等,无需人为参与,大大减轻了IT运维工作量。
实现自动化IT运维,简化IT运维工作,提高运维效率
提供可视化的监控与故障数据分析及展示
-
平台具备强大的大数据分析能力与展示能力
-
平台将整合当前与历史监控数据进行深度分析,分析故障特征,辅助发现问题根源
-
平台将对IT监控数据全面的分析,定期输出分析报告,支持企业从传统运维统计转向智能运维分析
-
平台具备强大的图形化数据展示开发能力,支持个性化数据展示开发
-
平台支持各类图形化的数据展示并支持大屏设备
-
提供数据与信息推送功能,支持各种方式的数据推送方式
提供可视化的监控与故障数据分析及展示
方案应用全景示意图·打造主动式IT巡检运维模式
方案应用全景示意图·打造主动式IT巡检运维模式
方案应用价值示意图·支撑企业IT监控运维的智能化升级
方案应用价值示意图·支撑企业IT监控运维的智能化升级
本解决方案对于企业的核心价值
本解决方案对于企业的核心价值
IT监控运维管理平台建设方案
系统建设目标与内容
-
搭建智能IT监控平台:搭建部一套智能化的IT系统监控运维平台,基于该平台实现对各IT系统集中监控与维护
-
优先监控四大平台:WLAN、智慧社区、视频监控、移动办公。视频监控和WLAN实现与硬件对接
-
实现自动采集、自动监控、自动告警、自动运维修复、自动部署
-
实现巡检规则配置,自动执行巡检,生成巡检报告
系统建设目标与内容
平台总体架构
平台总体架构
平台功能架构
平台功能架构
平台技术架构
平台技术架构
技术架构-监控自动部署流程
技术架构-监控自动部署流程