Zabbix
zabbix([`zæbiks])是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。
zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。
肥叔菌
本博客主要用于记录学习过程中的笔记,每隔一段时间,博主将会将精华内容整合发到知乎、简书上。欢迎关注博主肥叔菌在其他平台上的账号,谢谢。
B站:https://space.bilibili.com/456254145
segmentfault:https://segmentfault.com/u/feishujun/articles
简书:https://www.jianshu.com/u/67bab078551a
展开
-
Prometheus的指标分类
Prometheus 指标分为 Counter (计数器) Gauge (仪表盘)、Histogram (直方图)、Summary (摘要)Counter 是计数器类型,它的特点是只增不减,例如机器启动时间、 HTTP 访问量等 。Counter 具有很好的不相关性,不会因为机器重启而置 我们在使用 Counter指标时,通常会结合 rate ()方法获取该指标在某个时间段的变化率,例如,“ HTTP请求总量”指标就属于典型的 Counter 指标,通过对它进行 rate ()操作,可以得出请求的转载 2021-12-02 23:13:45 · 1441 阅读 · 0 评论 -
PostgreSQL数据库——Pigsty grafana dashboards
Pigsty grafana dashboardsPigsty dashboards提供如下dashboard:Baseline Dashboards (core application)PostgreSQL Metrics MonitoringPostgreSQL Log AnalysisPostgreSQL Catalog Explore提供grafana.py用于初始化pigsty baseline dashboards、dump pigsty dashboards、加载pigsty..原创 2021-11-29 13:05:04 · 1002 阅读 · 0 评论 -
Prometheus学习笔记——启动Grafana
原创 2021-11-28 20:41:35 · 238 阅读 · 0 评论 -
Prometheus学习笔记——监控Flink
原创 2021-11-28 20:38:56 · 664 阅读 · 0 评论 -
解决prometheus查询不到数据,报错Error fetching server time的问题
prometheus前端页面有如下警告这是由于你windows机器与部署prometheus服务器的时间不同步导致的在服务器执行ntpdate ntp.aliyun.com就能正常查到数据了原创 2021-11-28 17:03:36 · 1627 阅读 · 0 评论 -
Prometheus学习笔记——使用Grafana创建可视化Dashboard
Prometheus UI提供了快速验证PromQL以及临时可视化支持的能力,而在大多数场景下引入监控系统通常还需要构 建可以长期使用的监控数据可视化面板(Dashboard)。这时用户可以考虑使用第三方的可视化工具如Grafana, Grafana是一个开源的可视化平台,并且提供了对Prometheus的完整支持。docker run -d -p 3000:3000 grafana/grafana访问http://localhost:3000就可以进入到Grafana的界面中,默认情况下使用账户ad原创 2021-11-25 22:21:34 · 2166 阅读 · 0 评论 -
Prometheus学习笔记——使用PromQL查询监控数据
Prometheus UI是Prometheus内置的一个可视化管理界面,通过Prometheus UI用户能够轻松的了解 Prometheus当前的配置,监控任务运行状态等。 通过 Graph 面板,用户还能直接使用 PromQL 实时查询监控数 据:切换到 Graph 面板,用户可以使用PromQL表达式查询特定监控指标的监控数据。如下所示,查询主机负载变化情 况,可以使用关键字 node_load1 可以查询出Prometheus采集到的主机负载的样本数据,这些样本数据按照时间先 后顺序展示,形成了原创 2021-11-25 13:03:22 · 1281 阅读 · 0 评论 -
Prometheus学习笔记——使用Node Exporter采集主机运行数据
运行node exporter:node_exporter启动成功后,可以看到以下输出:INFO[0000] Listening on :9100 source="node_exporter.go:76"初始Node Exporter监控指标访问http://localhost:9100/metrics,可以看到当前node exporter获取到的当前主机的所有监控数据,如 下所示。每一个监控指标之前都会有一段类似于如下形式的信息:# HELP node_cpu Seconds the cpus原创 2021-11-24 12:56:34 · 1774 阅读 · 0 评论 -
Prometheus学习笔记——安装Prometheus Server
Prometheus基于Golang编写,编译后的软件包,不依赖于任何的第三方依赖。用户只需要下载对应平台的二进制 包,解压并且添加基本的配置即可正常启动Prometheus Server。从二进制包安装对于非Docker用户,可以从https://prometheus.io/download/找到最新版本的Prometheus Sevrer软件 包:export VERSION=2.4.3 curl -LO https://github.com/prometheus/prometheus/rele原创 2021-11-24 12:42:50 · 1061 阅读 · 0 评论 -
Prometheus学习笔记——Prometheus的优势
Prometheus是一个开源的完整监控解决方案,其对传统监控系统的测试和告警模型进行了彻底的颠覆,形成了基于 中央化的规则计算、统一分析和告警的新模型。 相比于传统监控系统Prometheus具有以下优点:易于管理Prometheus核心部分只有一个单独的二进制文件,不存在任何的第三方依赖(数据库,缓存等等)。唯一需要的就是 本地磁盘,因此不会有潜在级联故障的风险。Prometheus基于Pull模型的架构方式,可以在任何地方(本地电脑,开发环境,测试环境)搭建我们的监控系统。 对于一些复杂的情况,还原创 2021-11-23 23:35:19 · 1720 阅读 · 0 评论 -
Prometheus学习笔记——启动
Prometheus Server目录下执行启动命令:nohup ./prometheus --config.file=prometheus.yml > ./prometheus.log 2>&1 &Pushgateway目录下执行启动命令:nohup ./pushgateway --web.listen-address :9091 > ./pushgateway.log 2>&1 &Alertmanager目录下启动命令:nohup ./aler原创 2021-11-21 20:33:08 · 2350 阅读 · 0 评论 -
读书笔记-企业级分布式监控系统-概述
一个监控系统的组成大体可以分为两个部分:数据采集部分(客户端)和数据存储分析告警展示部分(服务器端)。数据采集的工作模式可以分为被动模式(服务器端到客户端采集数据)和主动模式(客户端主动上报数据到服务器端)。采集数据的协议方式可分为:专用客户端采集和公用协议采集(SNMP、SSH、Telnet等)。...原创 2020-06-05 22:30:36 · 8174 阅读 · 0 评论