监控系列
运维工作中最重要的就是监控,可以提前发现问题,然后解决问题,避免造成更大的问题,我整理了一下以前工作中常用的监控工具,希望能对大家有所帮助
平凡似水的人生
人的梦想是不会被终结的
展开
-
zabbix proxy配置
一、安装1、安装依赖包yum -y install net-snmp-devel libxml2-devel mariadb* libcurl-deve libevent libevent-devel2、解压并编译tar zxf zabbix-3.4.2.tar.gz cd zabbix-3.4.2./configure --prefix=/data/zabbix --enable-agent --enable-server --enable-proxy --with-mysql --wit原创 2022-01-02 23:05:35 · 1533 阅读 · 0 评论 -
open-falcon监控redis
1、编写redis-monitor.py#!/bin/env python#-*- coding:utf-8 -*-__author__ = 'iambocai'import jsonimport timeimport socketimport osimport reimport sysimport commandsimport urllib2, base64class RedisStats: # 如果你是自己编译部署到redis,请将下面的值替换为你到redis-cl原创 2021-12-25 22:57:34 · 188 阅读 · 1 评论 -
open-falcon自定义监控设置方法
1、使用shell脚本获取结果值: 0或1vim /data/python/monitor-port.sh#!/bin/bash#监控端口INPUT=$1VALUE=`/usr/bin/netstat -ntl | grep ${INPUT} |awk '{print $4}' | awk -F: '{print $2}' | grep "^${INPUT}$"`if [ $? -eq 0 ];then echo "1"else echo "0"fi2、使用Python脚本push数原创 2021-12-25 22:54:06 · 1057 阅读 · 0 评论 -
open-falcon配置集群监控
1、配置新的主机组2、配置集群聚合3、配置模板4、绑定模板和endpoint原创 2021-12-24 21:18:28 · 424 阅读 · 0 评论 -
open-falcon监控rabbitmq
1、监控脚本#!/bin/env python#-*- coding:utf-8 -*-__author__ = 'iambocai'import sys, urllib2, base64, json, time,socketstep = 60ip = socket.gethostname()print ipts = int(time.time())keys = ('messages_ready', 'messages_unacknowledged')rates = ('ack'原创 2021-12-24 21:15:26 · 921 阅读 · 0 评论 -
open-falcon监控mysql
1、安装go get -u github.com/open-falcon/mymoncd $GOPATH/src/github.com/open-falcon/mymonmake2、配置vim etc/myMon.cfg3、添加计划任务*/1 * * * * cd /home/src/github.com/open-falcon/mymon && ./mymon -c etc/myMon.cfg4、常用监控指标吞吐量 Questions 已执行的由客原创 2021-12-24 21:10:42 · 188 阅读 · 0 评论 -
open-falcon监控MongoDB
1、安装cd /data/monitorgit clone https://github.com/ZhuoRoger/mongomon.git2、配置修改默认endpoint名称vim /data/monitor/mongomon/bin/mongodb_monitor.py 填写连接信息:vim /data/monitor/mongomon/conf/mongomon.conf3、添加计划任务*/1 * * * * cd /data/monitor/mongomon/bin原创 2021-12-24 21:08:03 · 923 阅读 · 0 评论 -
open-falcon集成grafana
1、安装wget https://s3-us-west-2.amazonaws.com/grafana-releases/release/grafana-4.6.0-1.x86_64.rpmyum localinstall grafana-4.6.0-1.x86_64.rpm -y2、配置vim /etc/grafana/grafana.ini 启动: /etc/init.d/grafana-server restart 默认端口:30004、安装open-falcon插件graf原创 2021-12-24 21:05:45 · 1412 阅读 · 0 评论 -
open-falcon分布式安装
一、节点模块分布node1:agent、transfer、api、hbs、alarm、aggregator、chatnode2:agent、graph、dashboard、judge、nodata、mail-provider、mysql、redis均部署在node1上。二、安装1、直接把相应的模块拷贝到每台服务器上node1:node2:2、修改agent配置node1:cd /data/open-falcon/agent/configvim cfg.jsonnod原创 2021-12-24 21:01:31 · 842 阅读 · 0 评论 -
open-falcon 修改报警信息模板
前言open-falcon默认的报警信息模板含义不太清晰,如何自定义报警信息格式那,在这里分享给大家。1、添加环境变量vim /etc/profileexport GOROOT=/data/goexport GOPATH=/home 2、拉包mkdir -p $GOPATH/src/github.com/open-falconcd $GOPATH/src/github.com/open-falcongit clone https://github.com/open-falcon/fa原创 2021-12-21 22:53:57 · 463 阅读 · 0 评论 -
open-falcon nodata配置
前言Nodata用于检测监控数据的上报异常。nodata和实时报警judge模块协同工作,过程为: 配置了nodata的采集项超时未上报数据,nodata生成一条默认的模拟数据;用户配置相应的报警策略,收到mock数据就产生报警。采集项上报异常检测,作为judge模块的一个必要补充,能够使judge的实时报警功能更加可靠、完善。1、配置步骤如下2、设置templates3、然后配置hostgroups来绑定主机与模板4、然后把一台服务器的agent关掉,查看是否报警...原创 2021-12-19 18:32:15 · 259 阅读 · 0 评论 -
open-falcon配置报警
前言监控最重要的莫过于报警了,在这里给大家分享一下open-falcon如何配置报警的。一、邮件告警1、下载二进制包wget http://cactifans.hi-www.com/open-falcon/mail-provider.tar.gz2、创建工作目录并解压文件mkdir /data/open-falcon/mail-providertar zxf mail-provider.tar.gz -C /data/open-falcon/mail-provider/3、修改配置原创 2021-12-18 22:44:48 · 1087 阅读 · 0 评论 -
open-falcon单机部署
前言open-falcon是一款用golang和python写的监控系统,由小米开源这个项目。一、环境准备1、安装go语言环境wget https://dl.google.com/go/go1.14.2.linux-amd64.tar.gztar zxf go1.14.2.linux-amd64.tar.gz -C /datavim /etc/profileexport PATH=$PATH:/data/go/binsource /etc/profile2、安装redisyum原创 2021-12-17 20:34:11 · 2199 阅读 · 0 评论 -
prometheus altermanager高可用部署
架构一、部署1、安装首先准备两个Alertmanager节点,然后启动即可。2、组成gossip集群#gossip集群搭建,多个Alertmanager可以组成gossip集群,需要在Alertmanager启动时设置相应的参数。其中主要的参数包括:--cluster.listen-address: 当前alertmanager在gossip集群的监听地址--cluster.peer: 需要关联的gossip集群的监听地址#启动#node1:nohup ./alertmanage原创 2021-12-16 21:35:34 · 839 阅读 · 0 评论 -
prometheus部署集群联邦
前言在生产环境中,如果使用一个prometheus的话,随着监控数据的持续增长,将会导致压力越来越大,这时候可以采用prometheus的集群联邦模式,就是部署多个prometheus的从节点,分别负责不同的监控数据采集,主节点负责汇总数据与grafana数据展示,可以很好地解决这种问题。架构图一、安装主节点1、解压安装包tar zxf prometheus-2.19.1.linux-amd64.tar.gz -C /data/2、配置cd /data/prometheus-2.19.1原创 2021-12-15 19:39:28 · 7865 阅读 · 0 评论 -
prometheus从外部监控k8s集群
前言K8s为阿里云平台的服务,其中的监控组件已经安装,直接调用即可。自建k8s的话,需要先安装相对应的监控组件。本次监控是从外部监控k8s集群的。一、配置k8s1、创建用于 Prometheus 访问 Kubernetes 资源对象的 RBAC 对象#查看监控pod所在namespacekubectl get pods -A |grep kube-statevim prom.rbac.yamlapiVersion: v1kind: ServiceAccountmetadata:原创 2021-12-13 17:33:58 · 4559 阅读 · 9 评论 -
prometheus使用redis_exporter监控redis
一、安装redis_exporter1、安装tar zxf redis_exporter-v1.9.0.linux-amd64.tar.gz -C /data/2、启动redis_exporternohup ./redis_exporter -web.listen-address :9121 -redis.addr 192.168.84.129:6379 -redis.password 123456 &二、配置使用1、添加prometheus配置vim /data/prometh原创 2021-12-12 21:05:53 · 1259 阅读 · 0 评论 -
prometheus使用mysqld-exporter监控mysql
一、安装1、被监控mysql机器安装mysqld-exportertar zxf mysqld_exporter-0.12.1.linux-amd64.tar.gz -C /data/2、添加配置文件cd /data/mysqld_exporter-0.12.1.linux-amd64vim .my.cnf[client]user=rootpassword=1234563、启动mysqld-exporternohup ./mysqld_exporter --config.my-cn原创 2021-12-12 21:01:57 · 1039 阅读 · 0 评论 -
prometheus使用alertmanager实现报警功能
前言在运维工作中,最重要的事情就是监控,监控中最重要的就是报警功能,这样可以使我们收到告警之后及时处理,以免事态发展到无可挽回的地步,下面就给大家分享一下prometheus中的告警如何实现吧。一、安装altermanager1、解压安装包tar zxf alertmanager-0.21.0.linux-amd64.tar.gz -C /data/#查看是否安装成功cd /data/alertmanager-0.21.0.linux-amd64/./alertmanager --ver原创 2021-12-10 21:16:22 · 5216 阅读 · 6 评论 -
prometheus使用process-exporter监控服务器进程
前言prometheus中使用process-exporter进行对服务器进程的数据采集,在这里给大家简单的分享一下。一、安装1、解压安装包tar zxf process-exporter-0.5.0.linux-amd64.tar.gz -C /data/2、添加配置cd /data/process-exporter-0.5.0.linux-amd64/vim process-name.yamlprocess_names: - name: "{{.Matches}}" c原创 2021-12-09 19:58:08 · 1856 阅读 · 0 评论 -
Prometheus使用blackbox_exporter来监控相应指标
前言blackbox_exporter是Prometheus 官方提供的 exporter 之一,可以提供 http、dns、tcp、icmp 的监控数据采集。使用场景HTTP 测试定义 Request Header 信息判断 Http status / Http Respones Header / Http Body 内容TCP 测试业务组件端口状态监听应用层协议定义与监听ICMP 测试主机探活机制POST 测试接口联通性SSL 证书过期时间一、安装1、解压安装包t原创 2021-12-08 21:37:19 · 1926 阅读 · 0 评论 -
Prometheus安装与简单使用
前言Prometheus是一个开源的系统监控和报警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF托管的项目。prometheus使用非常灵活,可以自定义各种exporter来实现需求,在这里为大家分享一下prometheus的使用方法,希望能对大家有所帮助。一、安装1、解压安装包tar zxf prometheus-2.19.1.linux-amd64.tar.gz -C /data/2、配置cd /data/prometheus-2.19.1.linux-amd64原创 2021-12-07 21:17:24 · 929 阅读 · 0 评论