常见运维监控系统的技术选型

本文探讨了运维监控系统的技术选型,包括其功能、工作位置、核心组件和技术关键点,介绍了Zabbix、Prometheus及OpsMind等常见方案,并讨论了未来技术趋势,强调监控系统在业务价值体现和数据驱动运维的重要性。
摘要由CSDN通过智能技术生成

当今监控乃至整个运维行业正处在变更之际,面对诸多变化和不确定性,运维监控的规划应该首先考虑保证技术投资的可持续性,避免锁定在某一具体的架构和方案上,而是立足核心技术要点与诉求,跟随技术潮流,平滑演进,保持技术先进性,在演进过程中分阶段持续输出业务价值。本文将介绍几种常见运维监控系统的技术选型。

监控系统的功能

监控系统是运维系统或平台系统中较为核心的组成部分,它承载了运维工作中数据闭环的部分。从功能角度,监控系统分为数据采集功能、数据上报功能、数据存储功能、告警功能、大屏功能、报表功能等功能模块;从技术场景角度,监控系统又可以分为机房监控、硬件监控、网络监控、操作系统监控、中间件监控、云平台监控、业务监控、拨测监控等垂直技术领域;从业务场景角度,监控系统还可以分为资源类监控、成本类监控、审计类监控、质量类监控、运营类监控、安全类监控等垂直业务领域。

无论从哪个角度划分,监控系统的核心职责是保证平台所有信息的及时采集、正确处理、准确告警和合理展示。

监控系统的工作位置

运维负责支撑业务模块的正常运行,这需要从最底层的云或硬件开始构建运维技术栈,按下图所示,一般来说运维技术栈的职能从下往上依次包括环境(如 IDC 机房)、设备(如云主机、硬盘)、基础软件系统(如 linux)、部署和管理(如 docker、k8s)、中间件(如 mysql 数据库)、业务调度,最终到最上层的业务模块。不同公司、不同业务场景下,运维的技术栈的实现方式会有很大区别,但从功能上不会超出下图所示的范围。
在这里插入图片描述

在运维技术栈中,监控系统(如上图右侧所示)需要在垂直维度上负责所有层次、所有组件的工作状态收集和风险预警。监控系统的工作位置贯穿了运维技术栈的所有层次,这对监控系统在技术上的全面性、可靠性和工程上的强度提出很高要求。

监控系统的核心组件

数据采集器

数据采集器一般是支持插件机制的数据采集和数据上报工具。它可以从自己所运行的系统上直接采集相关运维数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值