前言
zabbix作为开源监控平台,其强大是业界公认的。如果想了解zabbix具体功能及使用方法,可以参考链接:
zabbix从入门从精通、官方说明文档(什么,打不开?多刷几次 :) )
言归正传,下面就对zabbix维护状态的实现做一个代码层面的分析说明。
版本
本文针对的zabbix版本是2.4.8
文件
主要涉及文件:timer.c
函数调用关系
zabbix server 启动过程中,专门创建了一个timer进程,用于维护状态。
timer进程的入口函数:
ZBX_THREAD_ENTRY(timer_thread, args)
{
...
}
从函数名称上看,像是线程。实际上,是宏定义封装的进程。
timer进程的执行过程如下图所示:
- timer进程每隔30s调用函数process_maintenance(),进行主机维护状态检查和管理。
- 该函数依次调用process_maintenance_hosts()、update_maintenance_hosts().
process_maintenance_hosts()工作包括:
- 查询表maintenance、timeperiod、maintenance_window,得到所有处于维护期的maintenaceid;
- 针对每个maintenanceid,查询表hosts、maintenance_host,得到所有处于监控状态的主机;
- 创建处于维护状态的主机列表,将监控主机插入列表。具体过程,调用的是get_host_maintenance();update_maintenance_hosts()工作包括:
- 对比maintenance表和host表中状态等字段,对于刚加入维护状态的主机,更新这些主机的host表状态等,并更新内存中的host链表中主机状态;
- 查询hosts表,获得所有处于维护状态但不在主机维护链表中的主机(即维护状态已过期的主机);
- 对于维护状态已经过期的主机,更新hosts表中以及内存中host链表中的主机状态,并产生event;在函数process_maintenance()的最后,销毁创建的维护主机列表。
数据库表关系
主要涉及的表包括:
maintenances、maintenances_windows、timeperiods、
maintenances_hosts、hosts、
maintenances_groups、hosts_groups
ER图关系如下图所示:
总结
本文对zabbix维护状态的实现进行了浅析,主要从函数调用关系和数据库表关系方面做了阐释。以此做个记录,方便以后查阅。