zabbix从放弃到入门（1）：zabbix概念

最新推荐文章于 2022-06-18 16:08:13 发布

Subin_

最新推荐文章于 2022-06-18 16:08:13 发布

阅读量231

点赞数

分类专栏：网站运维服务器

原文链接：http://www.zsythink.net/archives/447

版权

服务器同时被 3 个专栏收录

9 篇文章 0 订阅

订阅专栏

网站

7 篇文章 0 订阅

订阅专栏

运维

2 篇文章 0 订阅

订阅专栏

本文深入探讨了Zabbix监控系统的核心功能与工作原理，包括如何通过多种通讯方式监控硬件资源，以及Zabbix的分布式监控机制。介绍了Zabbix的组件如agent、server、proxy等，并解释了主动与被动监控模式。

摘要由CSDN通过智能技术生成

对于运维人员来说，监控是非常重要的，因为如果想要保证线上业务整体能够稳定运行，那么我们则需要实时关注与其相关的各项指标是否正常，而一个业务系统的背后，往往存在着很多的服务器、网络设备等硬件资源，如果我们想要能够更加方便的、集中的监控他们，我们则需要依靠一些外部的工具，而zabbix就是一个被广泛使用的，可以实现集中监控管理的应用程序。

我们监控的初衷就是当某些指标不符合我们的需求时，我们能够在第一时间发现异常，所以，监控工具需要定期的对被监控主机进行检查、信息收集等操作，当被监控主机出现异常时，能够及时报警、通知管理员，并且需要记录这些异常，以便我们分析这些数据，查漏补缺，那么，一个监控工具就应该具备采集信息、存储信息、展示信息、报警通知等功能，而zabbix就可以做到这些，除了zabbix，你可能还听说过cacti、nagios、ganglia等类似的监控系统，但是此处，我们只聊zabbix。

好了，我们大概了解了一下zabbix，那么我们通过zabbix能够监控哪些硬件资源呢，理论上来说，只要是与我们的业务有关的硬件资源，都应该被监控，比如主机、交换机、路由器、UPS等等，但是，监控它们的前提是能与它们进行通讯，那么问题来了，由于硬件的不同，导致我们无法使用统一的方法去监控他们，这个时候，就需要监控程序有一定的通用性，或者说，监控程序需要能够与多种硬件设备通讯，才能满足我们的监控需求，举个例子：如果被监控的对象是一台安装了linux操作系统的服务器，那么我们可以通过ssh或者telnet这种远程工具与被监控对象建立起通讯的通道，可是如果被监控的对象是一台安装了其他操作系统的服务器呢，更甚之，被监控的对象并不是服务器，而只是一台交换机或者路由器呢，所以，zabbix如果想要能够全面的监控这些对象，则需要能够通过各种方法与它们进行通讯。

那么zabbix能够支持哪些通讯方式呢，总结如下：

agent：通过专用的代理程序进行监控，与常见的master/agent模型类似,如果被监控对象支持对应的agent，推荐首选这种方式。

ssh/telnet：通过远程控制协议进行通讯，比如ssh或者telnet。

SNMP：通过SNMP协议与被监控对象进行通讯，SNMP协议的全称为Simple Network Management Protocol ,被译为 "简单网络管理协议"，通常来说，我们无法在路由器、交换机这种硬件上安装agent，但是这些硬件往往都支持SNMP协议，SNMP是一种比较久远的、通行的协议，大部分网络设备都支持这种协议，其实SNMP协议的工作方式也可以理解为master/agent的工作方式，只不过是在这些设备中内置了SNMP的agent而已，所以，大部分网络设备都支持这种协议。

IPMI：通过IPMI接口进行监控，我们可以通过标准的IPMI硬件接口，监控被监控对象的物理特征，比如电压，温度，风扇状态，电源状态等。

JMX：通过JMX进行监控，JMX（Java Management Extensions，即Java管理扩展），监控JVM虚拟机时，使用这种方法也是非常不错的选择。

好了，我们刚才提到了zabbix agent，一般情况下，我们将zabbix agent部署到被监控主机上，由agent采集数据，报告给负责监控的中心主机，中心主机也就是master/agent模型中的master，负责监控的中心主机被称为zabbix server，zabbix server将从agent端接收到的信息存储于zabbix的数据库中，我们把zabbix的数据库端称为zabbix database，如果管理员需要查看各种监控信息，则需要zabbix的GUI，zabbix的GUI是一种Web GUI，我们称之为zabbix web，zabbix web是使用php编写的，所以，如果想要使用zabbix web展示相关监控信息，需要依赖LAMP环境，不管是zabbix server ，或是zabbix web，他们都需要连接到zabbix database获取相关数据，这样说可能不容易理解，对比下图理解上述概念，就容易许多

当监控规模变得庞大时，我们可能有成千上万台设备需要监控，这时我们是否需要部署多套zabbix系统进行监控呢？如果部署多套zabbix监控系统，那么监控压力将会被分摊，但是，这些监控的对象将会被尽量平均的分配到不同的监控系统中，这个时候，我们就无法通过统一的监控入口，去监控这些对象了，虽然分摊了监控压力，但是也增加了监控工作的复杂度，那么，我们到底该不该建立多套zabbix监控系统从而分摊巨大的监控压力呢？其实，zabbix天生就有处理这种问题的能力，因为zabbix支持分布式监控，我们可以把成千上万台的被监控对象分成不同的区域，每个区域中设置一台代理主机，区域内的每个被监控对象的信息被agent采集，提交给代理主机，在这个区域内，代理主机的作用就好比zabbix server，我们称这些代理主机为zabbix proxy，zabbix proxy再将收集到的信息统一提交给真正的zabbix server处理，这样，zabbix proxy分摊了zabbix server的压力，同时，我们还能够通过统一的监控入口，监控所有的对象，当监控规模庞大到需要使用zabbix proxy时，zabbix的架构如下图，我们可以对比下图，理解上述描述。