linux监控
监控系统
wyl9527
将平时的工作进行一下总结。。。。
展开
-
alertmanager告警groupkey字段去除
【代码】alertmanager告警groupkey字段去除。原创 2024-08-24 09:23:30 · 134 阅读 · 0 评论 -
redis数据库中key的数量监控
【代码】redis数据库中key的数量监控。原创 2022-12-26 21:34:20 · 421 阅读 · 0 评论 -
腾讯云短信告警
【代码】腾讯云短信告警。原创 2022-11-16 16:35:10 · 1872 阅读 · 0 评论 -
监控正向代理
1.其他环境下的配置http_post_url: "http://公网ip:8189/alert/kibana"http_post_static_payload: subject: xxxxxxx告警:<a href="http://xxx">kibana地址</a> message: xxxxxxx告警,请注意查看2.公网IP,NGINX上的配置如下下面就是上述说到公网ip的机器上的nginx配置。stream {upstream es_原创 2022-05-09 22:14:32 · 623 阅读 · 0 评论 -
企业微信api发送告警信息
1.获取token企业微信获取token官网2.发送消息原创 2021-12-19 20:46:07 · 894 阅读 · 0 评论 -
Grafana自定义home页面
1、通过单击仪表板标题旁边的星号为该仪表板加星2、在左侧菜单上,将光标停留在 Configuration (齿轮)图标上,然后单击 Preferences 。3、首选项页面有 3 个指标可以进行修改,分别是 UI 主题、Home Dashboards、Timezone(时区),我们选择 Home Dashboards 进行修改,选择之前编辑好的 Dashboards,这里只显示加星的 Dashboards ,所以第一步要对 Dashboards 进行加星。4.这个页面需要提前准备好在/usr/原创 2021-09-08 20:51:43 · 4937 阅读 · 0 评论 -
prometheus在k8s中的部署
1.创建namespace、sa账号,在k8s集群的master节点操作#创建一个monitor-sa的名称空间kubectl create ns monitor-sa #创建一个sa账号kubectl create serviceaccount monitor -n monitor-sa #把sa账号monitor通过clusterrolebing绑定到clusterrole上kubectl create clusterrolebinding monitor-clusterrolebin原创 2021-05-24 14:38:12 · 1650 阅读 · 0 评论 -
Prometheus监控报警及自定义邮件模板
alertmanager的配置文件global: smtp_smarthost: 'localhost:25' smtp_from: 'alertmanager@example.org' #用于邮件通知的P发件人route: #每个输入警报进入根路由 receiver: 'team-X-mails' #根路由不得包含任何匹配项,因为它是所有警报的入口点原创 2021-04-01 19:36:53 · 3790 阅读 · 0 评论 -
Prometheus基于consul自动发现重新打标签
Prometheus在拉取exporter的数据之后,会对数据标签进行编辑,允许用户通过relabel_configs对标签进行处理,包括修改、删除标签以及删除不必要的标签。scrape_configs: - job_name: 'node' static_configs: - targets: ['127.0.0.1:9100'] relabel_configs: - source_labels: '[' <labelname> [, ...] ']'原创 2021-03-24 21:26:41 · 1280 阅读 · 0 评论 -
consul的集群部署
consul的原理Consul包含多个组件,但是作为一个整体,为你的基础设施提供服务发现和服务配置的工具.他提供以下关键特性:服务发现以及注册:当服务Producer 启动时,会将自己的Ip/host等信息通过发送请求告知 Consul,Consul 接收到 Producer 的注册信息后,每隔一段时间会向 Producer 发送一个健康检查的请求,检验Producer是否健康。服务调用:当 Consumer 请求Product时,会先从 Consul 中拿到存储Product服务的原创 2021-03-14 21:11:01 · 523 阅读 · 0 评论 -
Prometheus的服务发现
基于文件服务发现consul服务发现原创 2021-03-14 17:12:46 · 222 阅读 · 0 评论 -
PromQL语法
PromQL基础监控系统:采集,存储,可视化,告警grafana和告警都是PromQL数据:时间序列metric_name(label=“value”)原创 2021-03-14 17:10:32 · 809 阅读 · 0 评论 -
zabbix企业微信群告警
由于邮件告警很多人会忽视,所以选择企业微信告警。下面介绍如何去配置。1.注册企业微信,网上教程很多,可直接参考。2.创建应用,如下图所示3.在企业微信中拉一个群,然后添加机器人告警"<<运维告警>>"。群机器人的名称就是"运维告警"。3.、 在zabbix告警目录新建wechat.py脚本#!/usr/bin/python# -*- coding: utf-8 -*-import requestsimport jsonimport sys原创 2020-08-16 22:07:28 · 781 阅读 · 0 评论 -
grafana监控之node_export
1.下载node_exporterhttps://github.com/discoverygarden/node_export从github上下载node_export2.启动#ip:本机IPnohup ./node_exporter --web.listen-address=ip:9101 & 3.配置promethues4.重启promethues...原创 2019-12-04 22:03:33 · 445 阅读 · 0 评论 -
grafana插件饼图安装
1 在线安装Pie Chart[root@wyl01 ]# grafana-cli plugins install grafana-piechart-panelinstalling grafana-piechart-panel @ 1.3.9from url: https://grafana.com/api/plugins/grafana-piechart-panel/versions...原创 2019-12-02 19:33:10 · 2316 阅读 · 0 评论 -
zabbix监控redis
1.Redis存活监控redis存活监控 (redis_alive):redis本地监控agent使用ping,如果指定时间返回PONG表示存活,否则redis不能响应请求,可能阻塞或死亡。当返回值不为1时,redis挂了,告警,我们以阿里机器上的redis为例(集群部署):[root@bfd-ango-01 zabbix_agentd.d]# redis-cli -h 47.105.115....原创 2017-12-18 05:52:32 · 352 阅读 · 0 评论 -
zabbix中文乱码解决方案
我们在选择语言的时候有的人喜欢英文的画面,但是有时候可能需要输入中文的标题,如上图所示,我们看到中文输入后显示的是方框的样式,原因是因为zabbix自身对中文简体的支持不完善,需要我们手动的去上传新的字体进行替换。解决方法:1.我们在自己的笔记本电脑上找一个字体,如下图所示2 找到并上传到zabbix服务器的字体目录中每个人的安装的位置可能不太一样,我的是在/usr/share...原创 2018-06-28 06:02:49 · 230 阅读 · 0 评论 -
redis的监控
1 Redis存活监控redis存活监控 (redis_alive):redis本地监控agent使用ping,如果指定时间返回PONG表示存活,否则redis不能响应请求,可能阻塞或死亡。当返回值不为1时,redis挂了,告警[root@bfd-ango-01 zabbix_agentd.d]# redis-cli -h 47.105.115.143 -p 7000 -c ping |...原创 2019-05-27 11:09:36 · 437 阅读 · 0 评论 -
Grafana Prometheus系统监控Redis服务
目录1 prometheus的安装1.1 下载安装包1.2 配置Prometheus1.3 systemd管理Prometheus服务1.4 启动服务2 使用Prometheus监控redis服务2.1 下载redis_exporter安装包2.2 解压安装2.3 systemd管理redis_exporter服务2.4 启动服务3 Granfana...原创 2019-07-24 19:29:09 · 6102 阅读 · 3 评论 -
zabbix Too many processes on xxx
1、zabbix web页面登陆密码遗忘的问题# mysql -u root -p> use zabbix;>UPDATE users SET passwd=md5('123456') WHERE alias='Admin';>flush privileges;>quitmysql root密码遗忘问题# /etc/init.d/mysql stop# mysqld_safe --skip原创 2017-08-29 22:14:21 · 10522 阅读 · 2 评论 -
zabbix监控tcp的11种状态
监控tcp的11种状态1、编写shell脚本,传递参数,根据参数返回结果#!/bin/bashmetric=$1tmp_file=/tmp/tcp_status.txt/bin/netstat -an|awk '/^tcp/{++S[$NF]}END{for(a in S) print a,S[a]}' > $tmp_file case $metric in ...原创 2018-08-21 16:07:52 · 1785 阅读 · 0 评论 -
zabbix监控mysql的一些特性
1、zabbix有自带的mysql的模板,但是需要自己去到zabbix_agent中去配置和写脚本去获取这些key所对应的value.[root@wyl01 shell]# cat mysql_status.sh #!/bin/bashmysql=/usr/local/mysql/bin/mysqlusername='zabbix'password='zabbix'${mysq...原创 2018-08-23 23:29:15 · 358 阅读 · 0 评论 -
zabbix-添加主机、item、graph、screen。
1.添加主机2自动发现3创建item4创建graph5创建screen原创 2017-06-29 22:37:23 · 3958 阅读 · 0 评论 -
zabbix自动发现/注册
1、自动发现agent的机器上配置Server=172.24.5.149这个值就可以了(149是server端)。就会被自动发现,这里我们选择的机器是149-152 下面这个图是后来使用的服务器,不过原理是一样的,这里只设置了Server这个值,这里改成172.24.5.149即可。ServerActive是默认的没有动,在自动注册的时候需要修改这里的值。 点击Configuration>>Di原创 2017-07-23 17:58:12 · 461 阅读 · 0 评论 -
zabbix创建触发器、action,发送报警邮件
1、创建触发器点击>>Configuration>>Hosts>>Triggers 然后进去后我们可以选择点击右上角的Create trigger按钮创建,也可以选择系统的自带的item.。如下图所示。 点击创建触发器按钮,我们按照以下方式进行创建,其中表达式是不需要手动去写,是可以自动生成的,点击add按钮: 点击后的页面如下: 触发器创建之后我们可以看到列表中有一个我们刚刚创建的触发器,原创 2017-06-29 22:37:39 · 3810 阅读 · 0 评论 -
zabbix创建用户,用户组
1、创建用户组点击>>Administration>>User groups>>Create user group下图所示: 按照图中的内容填好后,还有一个Permission页面内容需要填写。 点击add保存后,我们可以看到一个group的列表,在后面我们会为某一个触发器创建action的时候可以选择一个组,那么组里面的所有人都可以收到报警邮件。我们也可以禁用这个组。 2、创建用户原创 2017-06-29 22:38:21 · 1222 阅读 · 0 评论 -
zabbix使用sendEmail实现邮件报警
sendEmail实现邮件报警安装sendEmailwget http://caspian.dotconf.net/menu/Software/SendEmail/sendEmail-v1.56.tar.gztar -xf /opt/software/zabbix/sendEmail-v1.56.tar.gz -C /opt编写发送报警邮件脚本#!/bin/bashfrom=yining原创 2017-06-29 22:36:19 · 1129 阅读 · 0 评论 -
Too many processes on hostname
1、问题描述:在zabbix的Dashboard仪表盘中看到这样的信息: 2、解决方法:点击 Configuration –> Host(点击某一个主机) –>Triggers,如下图所示: 我们找到Template OS Linux: Too many processes on {HOST.NAME}该触发器 1)第一可以修改这里的告警值,这里的显示的是300可以调到你想要调的值。 2原创 2017-08-29 22:11:28 · 3860 阅读 · 0 评论 -
zabbix自定义监控项
1、自定义监控项当zabbix自带的监控项已经不满足我们需要的时候,我们就需要自己定义监控项来满足我们的需求了。比如我们需要监控关于httpd的进程数。 我们找到/etc/zabbix/zabbix_agent.conf配置文件中找到UserParameter的配置项,配置内容如下: 配置完我们重启zabbix-agent。service zabbix-agent restart重原创 2017-07-23 17:57:57 · 778 阅读 · 0 评论 -
zabbix实现web监控
1、创建监控web点击Configuration>>Hosts>>Web点击去后点击Create web scenario。(我们选择在主机上去创建,当然我们也可以在模板上创建) 创建web监控的一些具体参数配置: 当前tab页面的内容是添加对哪一个页面进行监控,图中所填写的两个页面使我们自己创建的。(index 和login) 创建index.html和login.html(在cd /var/原创 2017-08-02 04:34:59 · 927 阅读 · 0 评论 -
zabbix监控MongoDB
1.MongoDB自带的监控[root@bfd-ango-01 shell]# mongostat -h 47.105.115.143:27017 -udolphin -pk8DDg9sd --authenticationDatabase admininsert query update delete getmore command flushes mapped vsize res fau...原创 2017-08-02 04:36:22 · 1011 阅读 · 0 评论 -
服务器死机连不上,zabbix报Trigger: Zabbix agent on Hostname is unreachable for 5 minutes
1、问题描述:出现过多次xshell连不上服务器,但是进程依然是在的。(当然可能也会出现进程不在了)。 1)查看kvm上的错误信息:(这里用他人的图,和kvm上的是一样的) 1)查看zabbix上该机器上网络情况: 2)查看 cat /proc/sys/kernel/hung_task_timeout_secs的值,原先该文件的值是120s,意思是120秒没同步完就会锁死。(可能就原创 2017-08-22 04:44:20 · 5008 阅读 · 0 评论 -
zabbix监控top下的某个进程的%cpu值。
1、背景描述这几天发现es的服务占用的cpu资源比较高,经常出现瞬间彪高的现象,对分析原因的产生所以我们需要知道该进程的%cpu变化值,但是我们总不能一直盯着屏幕看,所以用zabbix进行监控。 比如top查看下面的值:2、解决思路写python脚本获取当前你要的进程的%cpu的值其次在zabbix-agentd.d目录中添加.conf结尾的文件,具体之前zabbix自定义监控时有描述。在z原创 2017-12-08 04:59:10 · 4102 阅读 · 5 评论 -
zabbix监控nginx的进程和7种状态
1、编写shell脚本,传递参数,根据参数返回结果,和之前的tcp的脚本类似。#!/bin/bash#this script is used to get nginx connetion status#nginx statusHOST="10.10.252.211"PORT="8080" metric=$1tmp_file=/tmp/nginx_status.txt ...原创 2018-08-22 04:24:10 · 2838 阅读 · 2 评论 -
smokeping的安装
Smokeping允许你监测多台服务器。 Smokeping使用RRDtool来存储数据,另外,其可基于RRDtool输出生成相应的统计图表。 Smokeping由两个部分组成。一个运行在后台、定期收集数据的服务。一个以图表形式展示数据的Web界面。这个wiki页面包括安装smokeping后台服务和Web界面的基本步骤。1、安装lamp环境和rrdtool图形处理及其他所需依赖库:...原创 2018-08-15 22:25:36 · 2885 阅读 · 0 评论 -
zabbix_sender的使用,解决指令执行时间超过30秒
1、实际需求: 监控某个值,但是执行指令或者脚本获取该值,执行的命令或者脚本的时间超过了30s , zabbix就获取不到该值,所以这里我们需要使用zabbix_sender.zabbix中支持及于zabbix_sender和trapper的方式获取数据并监控,zabbix_sender的作用是将数据发送给zabbix server ;而什么是trapper呢?tapper也称作zabbix...原创 2018-07-02 18:15:33 · 4837 阅读 · 0 评论 -
zabbix 监控hbase、es、hadoop进程,发出报警和远程重启服务。
需求:当我们的服务器部署了很多服务后,和服务器数量过多时,我们怎么去管理所有的服务,以及服务进程停止,第一时间发出报警,然后先自动远程执行服务。1、下面我们举个例子,zabbix监控报警和自动执行服务的启动指令。对于hadoop,hbase,es这样的集群部署,首先我们需要创建模板,将模板套进该集群组中。具体情况如下,这里我们直接讲过程,具体的每一步实现,在该系列博客中有讲到。这样每个集群组中机器...原创 2018-06-12 06:32:22 · 5743 阅读 · 0 评论 -
Zabbix的安装
本文档主要内容:Centos6.5Zabbix3.0.9 LTSphp 5.6 (require 5.4.0 or later not 7.0Apache (require 1.3.12 or later)MySQL 5.3 (require 5.0 or later)Apache安装: yum install httpd* 启动: service httpd ...原创 2018-02-08 10:39:11 · 889 阅读 · 0 评论 -
zabbix监控检测hbase的region一致性
一、背景环境1、http://localhost:16010/master-status查看hbase环境发现是正常的。 2、zabbix监控hbase的hmaster和hregion也是正常的 但是有时候会出现region的不一致性问题,这个我们也需要进行监控。二、监控方案shell脚本获取status的值,如果是OK则表示region是一一致性,如果是INCONSISTENT,表示有不一致原创 2017-12-20 00:04:42 · 1695 阅读 · 0 评论 -
zabbix-监控磁盘i/o
1、监控服务器上所有的磁盘瞬时读写操作:首先获取要监控的选项是什么其次对选取的值的一个获取最后对选取出来的值配置item,然后监控我们查看每个磁盘的瞬时读写的频率:[root@hadoop9 ~]# cat /proc/diskstats 1 0 ram0 0 0 0 0 0 0 0 0 0 0 0 1 1 ram1 0 0 0 0 0 0 0 0 0原创 2017-11-17 20:09:50 · 2855 阅读 · 0 评论