Monitor
文章平均质量分 84
本专栏学习记录系统监控、容器监控、业务监控等
寻花之梦~~
SRE
展开
-
自定义开发node_exporter脚本实现监控
早年在使用Zabbix监控时,可以自己写自定义脚本来监控指标。随着时代的变革,在使用Promethues的时候,有很多的exporter,但是有一些特殊的情况是没法实现的,比如,我需要监控统计每个idc的nginx error日志,计算最近1分钟的错误率,这时只能通过自定义开发脚本来实现一些特殊的需求。3)添加启动参数,node_exporter采集数据(采集频率为定时任务的频率)(3)监控Linux系统是否开启bbr,若没开启则触发告警。(1)监控统计指定目录下的文件数,若超过50触发告警。原创 2023-01-05 17:04:04 · 1902 阅读 · 1 评论 -
Linux 使用 atop 监控工具
atop是一款用于监控Linux系统资源与进程的工具,以一定的频率记录系统的运行状态,采集系统资源(CPU、内存、磁盘和网络)使用情况及进程运行情况数据,并以日志文件的方式保存在磁盘中。atop启动后,会将采集的数据记录在/var/log/atop目录的日志文件中。本文以操作系统为CentOS7.9的云服务器为例,介绍如何使用atop监控工具。n按照进程的网络使用率进行降序筛选(使用此命令需安装额外的内核模块,默认不支持)。d按照进程的磁盘使用率降序筛选。系统资源监控字段说明。...原创 2022-07-22 15:09:36 · 1754 阅读 · 0 评论 -
Prometheus Thanos 监控k8s多集群
文章目录简介Kubernetes普罗米修斯技术栈解决方案Thanos简介工作原理多集群架构在Grafana可视化总结简介在本文中,我们将看到Prometheus监控技术栈的局限性,以及为什么演进到基于Thanos的技术栈可以提高指标留存率并降低总体基础设施成本。实践thanos高可用prometheus集群部署参考链接:https://www.cuiliangblog.cn/detail/article/30Kubernetes普罗米修斯技术栈在为我们的客户部署Kubernetes基础设施时,在每原创 2022-02-16 11:42:17 · 1211 阅读 · 0 评论 -
Grafana监控告警指标
文章目录ES健康异常告警ES分片数告警ETCD状态异常告警Failed pod数量超过500 告警Open files 超过80%告警ES健康异常告警scalar(elasticsearch_cluster_health_status{color="green"}) + scalar(elasticsearch_cluster_health_status{color="yellow"}) * 2 + scalar(elasticsearch_cluster_health_status{color="r原创 2021-09-17 20:13:49 · 732 阅读 · 0 评论 -
部署N9e-v3运维监控平台
文章目录1. 夜莺介绍2. Nightingale架构3. 安装步骤4. 子系统简介5. 用户资源中心6. 资产管理系统7. 任务执行中心8. 监控告警系统1. 夜莺介绍官网:https://n9e.didiyun.com/Github地址:https://github.com/didi/nightingale==夜莺运维平台是滴滴开源的一个运维平台,有着滴滴公司最佳实践 ==夜莺拆成了四个子系统,分别为用户资源中心(RDB)资产管理系统(AMS)任务执行中心(JOB)监控告警系统(MO原创 2020-11-12 14:03:30 · 5369 阅读 · 0 评论 -
Docker容器云监控
1. 安装cadvisor + prometheus1. 环境:docker01 docker02 启动容器cadvisor 采集数据docker01 docker02 启动容器node-exporter 监控宿主机资源docker03 安装prometheus2. 增加node节点[docker01 && docker02]上传docker_mon...原创 2020-01-24 19:08:36 · 722 阅读 · 0 评论 -
解决Service Unavailable
描述:上周部署的Zabbix服务器,今早打开访问Server呈现上边报错!!!解决方案:1.查看阿帕奇日志,发现php start error[root@host1 httpd]# tail error_log [Sat Jun 20 11:28:26.896922 2020] [proxy:error] [pid 44690] (111)Connection refused: AH02454: FCGI: attempt to connect to Unix domain socket /var.原创 2020-06-20 11:36:21 · 2469 阅读 · 0 评论 -
重置Grafana密码
[root@yinwu ~]# find / -name "grafana.db"/data/docker/docker/overlay2/3a9ec5648aeb124a13270bacb66bb34e16c7f7112982e470a8cfa834c96778da/merged/var/lib/grafana/grafana.db/data/docker/docker/overlay2/3a9ec5648aeb124a13270bacb66bb34e16c7f7112982e470a8cfa834c原创 2020-10-13 16:32:23 · 209 阅读 · 0 评论 -
250. 部署alertmanager(监控告警)
1. 准备基础镜像[root@k8s7-200.host.com /opt/src]# docker pull docker.io/prom/alertmanager:v0.14.0[root@k8s7-200.host.com /opt/src]# docker tag 30594e96cbe8 harbor.od.com/infra/alertmanager:v0.19.0[root@k8s7-200.host.com /opt/src]# docker push harbor.od.com/i原创 2020-08-30 18:14:13 · 469 阅读 · 0 评论 -
249. 部署Grafana(皮肤)
文章目录1. 准备基础镜像2. 准备资源配置清单3. DNS解析4. 应用资源配置清单5. 浏览器验证6. 安装插件7. 检查插件8. 接入普罗米修斯9. 部分展示1. 准备基础镜像https://hub.docker.com/r/grafana/grafanahttps://github.com/grafana/grafanahttps://grafana.com/[root@k8s7-200.host.com /opt/src]# docker image tag 6f18ddf9e552 h原创 2020-08-28 20:13:29 · 625 阅读 · 0 评论 -
248. Prometheus监控业务容器
Prometheus监控内容Targets(jobs)1. traefik监控traefik-ingress-controller注意:在traefik的pod控制器上加annotations,并重启pod,监控生效配置范例:"annotations": { "prometheus_io_scheme": "traefik", "prometheus_io_path": "/metrics", "prometheus_io_port": "8080"}重启pod原创 2020-08-28 17:52:10 · 430 阅读 · 0 评论 -
247. 部署Prometheus(希腊神话)
文章目录1. 准备prometheus镜像2. 准备资源配置清单3. 准备Prometheus相关配置4. DNS解析5. 应用资源配置清单6. 浏览器访问验证1. 准备prometheus镜像https://hub.docker.com/r/prom/prometheushttps://github.com/prometheus/prometheus[root@k8s7-200.host.com /opt/src]# docker image tag 7317640d555e harbor.od.原创 2020-08-28 16:45:46 · 241 阅读 · 0 评论 -
246. 交付Exporters至k8s集群
文章目录1. kube-state-metrics1.1 准备基础镜像2. node-exportercadvisor1. kube-state-metrics1.1 准备基础镜像kube-state-metrics官方quay.io地址 https://quay.io/repository/coreos/kube-state-metrics?tab=info[root@k8s7-200.host.com /opt/src]# docker image tag 91599517197a harbor原创 2020-08-28 14:11:55 · 456 阅读 · 0 评论 -
245. Prometheus介绍
1. Prometheus介绍官网传送门—>https://prometheus.io/Prometheus 是一款基于时序数据库的开源监控告警系统,非常适合Kubernetes集群的监控。Prometheus的基本原理是通过HTTP协议周期性抓取被监控组件的状态,任意组件只要提供对应的HTTP接口就可以接入监控。不需要任何SDK或者其他的集成过程。这样做非常适合做虚拟化环境监控系统,比如VM、Docker、Kubernetes等。输出被监控组件信息的HTTP接口被叫做exporter 。目前互原创 2020-08-27 19:57:41 · 254 阅读 · 0 评论 -
227. Grafana安装、升级与备份
grafana安装、升级、备份教程注意: 在生产环境中低版本升级至最新版本(建议不要一次性夸大版本,按小版本依次升级迭代),同时也记得导出自己辛辛苦苦做的grafana模版图表进行备份!原创 2020-07-29 11:01:00 · 2407 阅读 · 0 评论 -
Prometheus+Grafana 云平台监控
文章目录1. Prometheus 概述2. Prometheus 架构图解2.1 Prometheus 各组件运行流程如下:3. 安装配置 Prometheus 监控服务4. 启动用于采集 Linux 系统和 mysql 服务状态的 exporter 服务5. 使用 Grafana 可视化工具美化监控数据6. 将监控 Linux 系统和 mysql 服务运行状态的 web 仪表盘插件导入 gra...原创 2020-02-28 23:36:39 · 1313 阅读 · 0 评论 -
Percona监控MySQL
1.前期准备:yum install php php-fpm php-mysqlsystemctl start mariadbgrant all on *.* to mysql@'localhost' identified by '123456';wget https://www.percona.com/downloads/percona-monitoring-plugins/percon...原创 2019-11-26 11:06:03 · 292 阅读 · 0 评论 -
基于LNMP架构构建Zabbix系统
1.准备工作安装Nginx,MySQL,PHPNginx 1.16.1MySQL 5.7.28PHP 7.1使用源码编译安装Zabbix下载源码包编译前配置编译并安装2.下载zabbix源码包文件1.下载zabbix源码包wget https://jaist.dl.sourceforge.net/project/zabbix/ZABBIX%20Latest%2...原创 2019-11-25 23:14:30 · 301 阅读 · 0 评论 -
Zabbix分布式监控及优化
1.zabbix分布式监控,模拟多机房实现监控1.有多机房时,需要用到proxy1.网络不通2.网络延迟2.当监控的主机较多时,也可以用proxy来缓解压力1.配置zabbix源【两个节点都要做】[root@web01 ~]# rpm -Uvh https://repo.zabbix.com/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0...原创 2019-11-23 19:22:40 · 310 阅读 · 0 评论 -
Zabbix自动化监控
1.zabbix的snmp监控? ( 不重要 )2.web监控pv uv ip请求延时响应延时加载时间网站慢则报警4.自动化监控:自动发现,网络发现主动注册主动模式与被动模式区别?主动模式与被动模式效果展示?https://blog.csdn.net/qq_28657577/article/details/82834442snmp基础介绍snmp全称是简单网络管理协议...原创 2019-11-21 19:01:03 · 452 阅读 · 1 评论 -
Zabbix监控公司服务
1.模板的重要1.手动添加监控比较麻烦,监控项 -> 图形 -> 触发器。问题: 1.例如: 100台服务器需要检查81端口 2.例如: 100台服务器81改成82解决: 使用模板可以解决以上问题, 只需要修改一下模板,然后所有的主机都生效2.两种模板系统自带模板自定义模板自定义模板的使用1.创建模板,模板得属于某个主机组(Templates)2.在模板中创...原创 2019-11-20 19:06:24 · 339 阅读 · 0 评论 -
Zabbix自定义监控项及告警升级
1.认识Template OS Linux 模块的所有监控项2.自定义一个监控项 ( 创建监控项中的所有选项 )原创 2019-11-19 23:02:12 · 462 阅读 · 0 评论 -
Zabbix监控
Zabbix入门必备1.配置zabbix源[root@zabbix ~]# cat /etc/yum.repos.d/zabbix.repo [zabbix]name=Zabbix Official Repository - $basearchbaseurl=https://mirrors.aliyun.com/zabbix/zabbix/3.5/rhel/7/$basearch/en...原创 2019-10-17 17:27:18 · 405 阅读 · 0 评论