Prometheus监控报警系统

最新推荐文章于 2025-04-07 10:21:07 发布

1BeLiEvEr1

最新推荐文章于 2025-04-07 10:21:07 发布

阅读量1.1k

点赞数

文章标签：服务器运维 prometheus

本文链接：https://blog.csdn.net/BeliefWish/article/details/121914653

版权

本文介绍了Prometheus监控系统的特点、使用场景、监控体系、时序数据和生态组件。Prometheus以其多维数据模型、高效的PromQL查询语言和灵活性成为云原生环境的理想监控工具。监控体系覆盖系统层、中间件、应用层、业务层和运维平台设计。Prometheus通过Pull模式收集数据，并与其他组件如Alertmanager、Exporters协同工作，提供全面的监控解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2、中间件及基础设施类监控端监控（移动APP、特定程序等)

6、Data Visualization (Dashboards)

2、prometheus每一份样本数据都包含了

3、指标类型

4、作业job和实例targets/instance

5、prometheusQL（数据查询语言也是时序数据库使用语言)

一、常用监控简介

1、Cacti

Cacti(英文含义为仙人掌〉是一套基于 PHP、MySQL、SNMP和 RRDtool开发的网络流量监测图形分析工具。

它通过snmpget来获取数据，使用RRDTool绘图，但使用者无须了解RRDTool复杂的参数。它提供了非常强大的数据和用户管理功能，可以指定每一个用户能查看树状结构、主机设备以及任何一张图，还可以与LDAP结合进行用户认证，同时也能自定义模板，在历史数据的展示监控方面，其功能相当不错。

Cacti通过添加模板，使不同设备的监控添加具有可复用性，并且具备可自定义绘图的功能，具有强大的运算能力（数据的叠加功能)。

2、Nagios

Nagios是一款开源的免费网络监视工具，能有效监控windows、Linux和Unix的主机状态，交换机路由器等网络设备打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员，在状态恢复后发出正常的邮件或短信通知。

Nagios主要的特征是监控告警，最强大的就是告警功能，可支持多种告警方式，但缺点是没有强大的数据收集机制，并且数据出图也很简陋，当监控的主机越来越多时，添加主机也非常麻烦，配置文件都是基于文本配置的，不支持web方式管理和配置,这样很容易出错,不宜维护。

3、Zabbix

Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数，保证服务器系统的安全运营;并提供强大的通知机制以让系统运维人员快速定位/解决存在的各种问题。

Zabbix由2部分构成，zabbix server与可选组件zabbix agent。zabbix server可以通过SNMP，zabbix acent，ping，端口监视等方法提供对远程服务器/网络状态的监视，数据收集等功能，它可以运行在Linux，Solaris，HP-UX，AIX，Free BSD , Open BSD，os x等平台上。

Zabbix解决了cacti没有告警的不足也解决了nagios不能通过web配置的缺点，同时还支持分布式部署，这使得它迅速流行起来，zabbix也成为目前中小企业监控最流行的运维监控平台。

当然，zabbix也有不足之处，它消耗的资源比较多，如果监控的主机非常多时（服务器数量超过500台)，可能会出现监控超时、告警超时、告警系统单点故障等现象，不过也有很多解决办法，比如提高硬件性能、改变zabbix监控模式等。

（1）agent代理:专门的代理服务方式进行监控，专属的协议，装有zabbix-agent的主机就可以被zabix-server监控，主动或被动的方式，把数据给到server进行处理。

（2）ssh/telent: linux主机支持ssh/telent协议

（3）snmp:网络设备路由器、交换机不能安装第三方程序(agent），使用简单网络协议。大多数的路由器设备支持SNMP协议

（4）ipmi:通过ipmi接口进行监控，我们可以通过标准的ipmi硬件接口，监控被监控对象的物理特征，比如电压，温度，风扇状态电源情况，被广泛使用服务监控中，包括采集cpu温度，风扇转速，主板温度，及远程开关机等等，而且ipmi独立于硬件和操作系统，无论是cpu，bios还是os出现故障，都不会影响ipmi的工作，因为ipmi的硬件设备BMC( bashboard management controller）是独立的板卡，独立供电。

（5）zabbix核心组件介绍

①Server：zabbix软件实现监控的核心程序，主要功能是与zabbix proxies和Aents进行交互、触发器计算、发送告警通知;并将数据集中保存。与prometheus的类似可以保存收集到的数据，但是prometheus告警需要使用alter manager组件；

②Database storage：存储配置信息以及收集到的数据；

③Web Interface：zabbix的GUI接口，通常与server运行在同一台机器上；

④Proxy:可选组件，常用于分布式监控环境中，一个帮助zabbix Server收集数据,分担zabbix Server的负载的程序；

⑤Agent：部署在被监控主机上，负责收集数据发送给server。