PART 01 项目背景
01客户简介
案例客户是一家大型基金管理公司,注册资本近13亿人民币。02痛点分析在新项目启动前,客户原有的运维监控软件面临着多项不足,如服务支持不足、告警规则配置不灵活、不合理、告警通知不及时、无法对接短信告警推送、权限控制不灵活等。这些问题的存在严重影响了运维效率,同时也增加了运维成本。
为了业务系统全方位的支撑与保障,重新建设一套统一、开放、自主可控、可持续发展的全栈运维监控平台已成为必要。
PART 02 乐维方案
乐维方案团队对该客户的IT环境进行了梳理:客户生产环境分为办公网、生产网两个环境,通过内网互联,生产网设备部署在专业化机房设施,使用专用链路连接,两个环境还分别搭建了VMWare虚拟化私有云,IT架构整体复杂度一般。基于客户需求与实况,乐维方案团队对项目实施规划如下:01底层架构设计经评估,该客户总体监控对象在800个以内,包括操作系统、网络设备、数据库、中间件、虚拟化、服务器、存储等资源。对此,乐维方案团队设计了如下系统架构:
架构说明:该方案设计了一个由三台服务器组成的监控平台架构。监控平台服务和Web服务部署在服务器
1,主要功能为采集监控对象数据存放在数据库,同时提供上层集中访问;Postgresql数据库部署在服务器
2,用于集中存储监控数据;机房建设后期新增大量硬件服务器设备,因此部署了代理采集服务在服务器3,帮助主采集节点分担压力并跨网络进行数据收集。
02重点功能
方案倡导打造从操作系统、网络设备、数据库、中间件、虚拟化、服务器、存储等一站式运维管理平台,实现整个基金业务系统和IT基础架构的统一集中管理。
2.1. 集中监控,分批次纳管基于方案打造的乐维智能监控平台提供了设备资源的集中监控能力。监控平台部署完成后,依设备类型、分批次分别进行操作系统、服务器、存储设备、网络设备、虚拟化、专线链路等监控纳管。
如图,平台的监控首页提供了对设备资源概况的集中展示,包括资源类型、数量、告警情况、重点关注指标(各类TOPN信息)等等,运维人员通过监控首页就可以对系统整体情况有一个初步的感知。
实施要点:操作系统纳管由于客户业务有严格的保密性和安全性要求,不允许操作系统需要安装agent用于数据采集,因此使用了SNMP网络管理协议进行监控。结合现场部署环境、调整好安装脚本,配置了客户机IP网段、SNMP V3服务后,通过一键监控功能实现了批量监控。
虚拟化
客户虚拟化使用了VMWare,并搭建了vcenter进行统一管理。结合乐维模板监控即采集python脚本,实现对象添加后,自动发现出宿主机、虚拟机、datastor三个主要对象并自动发现出其层级对应关系。
网络专线链路配置
客户生产网机房托管在异地,办公网机房与生产网存在关联、且这两条线路的通讯状态对于集团业务的运行至关重要,因此单独使用监控平台链路添加。对于两条网络对端设备不在本地问题,通过与生产、办公专网接入的交换机,配置NQA,实现本段设备探测对端网络的链路监控,获取链路健康状况、带宽利用率、链路丢包率等信息
服务器、存储设备、网络设备监控
客户的服务器、存储设备、网络设备是一些常规型号,乐维监控现有模板基本实现覆盖。虽然服务器不同厂商、不同型号存在内部mib库不一致情况,前期搜集时即核对模板样例,现有模板可直接准备,导入备用。根据搜集的客户网络设备信息,主要为华为网络设别、华三网络设别,核对了为模板库,都有现有模板,结合前期信息搜集时的管理IP地址、团体名,实现快速添加监控对象。
03标准化功能
根据客户需求,平台还配备了运维驾驶舱、网络拓扑、可视化管理、知识库、报表管理等标准化功能。运维驾驶舱:开箱即用,并且内置了令人惊艳的3D行星动态组件,能够为用户带来惊艳的视觉享受,全面提升使用体验。
网络拓扑:可基于网络协议自动发现网络设备、服务器、存储并生成关系图,同时支持Proxy发现,拓扑图生成后支持下钻至物理接入网,支持多层级管理,网络资源的异常可通过带宽利用率、趋势流量、告警闪烁等来表示,做到网络故障快速定位,帮忙运维人员快速掌握全局网络运行状态。
可视化管理:用户可以根据自己管理的需要灵活配置投屏视图,例如,主机系统管理视图、数据库监控管理视图等,实现多场景的运维管理模式。
可持续消费知识库:在故障产生时,系统能够自动推荐历史相似场景或告警,并复用历史解决方案。
报表管理:提供多种场景报表,包括实时报表、TOPN报表、流量报表、日报周报、自定义报表、主机性能报表(识别僵尸机器)、图形报表、巡检报表。
PART 03 客户收益
- 通过IT资产全面梳理、全栈监控、实时告警等新型智能运维手段,建设出一套完善且灵活的成熟运维体系,告别传统“救火”式运维,运维效率提升10倍,企业运维成本降低超过50%。2. 提供更有效的数据依据,推进集团信息化建设可持续发展,让信息化资源更合理的应用、最大化应用,为信息化建设提供导向。