自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(214)
  • 资源 (1)
  • 收藏
  • 关注

原创 Prometheus+Grafana全方位监控Kubernetes集群资源利用率

Prometheus+Grafana全方位监控Kubernetes集群文章目录Prometheus+Grafana全方位监控Kubernetes集群1.k8s监控指标2.k8s基础环境准备2.1.环境准备2.2.部署nfs作为prometheus存储2.3.获取prometheus yaml文件2.4.创建命名空间prometheus3.在k8s中部署prometheus3.1.prometheus-yaml准备3.2.创建rbac资源3.3.创建configmap资源3.4.创建statefulset资

2021-01-06 17:03:20 349 7

原创 Prometheus+Grafana监控系统配合Cadvisor监控Docker容器

prometheus使用cadvisor监控docker容器1.cadvisor概述一般公司会有很多docker主机,那么就需要对docker进行监控了,docker监控可以采用docker stats配合shell命令来取值做监控,但是无法传递给prometheus进行采集,zabbix监控docker又比较麻烦,因此就有了谷歌的cadvisorcadvisor不仅可以搜集一台机器上的所有运行的容器信息,还提供基础查询界面的http接口,方便prometheus进行数据抓取cadvisor可以对节

2020-12-24 14:43:43 1689 3

原创 利用zabbix api批量添加数百台监控主机

利用zabbix api批量添加监控主机在公司规模很庞大的时候,每次都手动添加监控主机将会很麻烦,我们可以利用zabbix的api去批量添加监控主机本次我们将实现用一台主机虚拟出100台主机,并通过api的方式自动添加监控主机有了本次方法,无需要了解python,也不需要写python脚本1.获取批量添加主机的api{ "jsonrpc": "2.0", "method": "host.create", "params": { "host": "192.16

2020-12-18 16:33:32 451 4

原创 zabbix-proxy分布式监控配置(二十五)

zabbix-proxy分布式监控配置1.分布式监控proxy介绍分布式proxy经常用于公司有多个机房之间进行使用,比如zabbix-server在北京的机房,还有一个机房在上海,上海的机器也要监控,如果搭建两套zabbix监控系统维护起来将非常麻烦,但是使用同一套zabbix监控系统,上海的服务器与北京的服务器也不会通信,也不能吧上海的机器全部配成公网ip。这时zabbix proxy分布式监控就可以完美的解决这个问题,只需要在上海机房搭建一个zabbix-proxy,定期的从zabbix-ser

2021-04-13 09:06:39 5

原创 Jenkins针对不同的项目视图对不同的用户进行权限分配

Jenkins创建用户并分配不同视图的权限根据不同的部门分配不同的角色,角色成员只能看到自己部门视图内部的jenkins jobJenkins版本:2.249因安装了中文包的原因,语言大多以中文的方式显示,但不影响配置使用Jenkins要想以视图分配权限,需要注意一个规范:在创建视图时以项目的缩写命名再加上项目的具体名称,例如:dev_boss,dev就是项目的整体名称,boss就是其中的一个模块,这样一来我们做权限分配时,以dev开头就能匹配到所有dev的项目并且在一个视图中显示1.安装权限

2021-04-12 14:25:45 8

原创 zabbix精华篇-低级自动发现详解---批量自动获取主机所有tomcat端口并进行监控(二十四)

zabbix利用低级自动发现自动监控tomcat端口1.为什么要使用自动发现由于我们tomcat服务器特别多,且每一个上面跑的实例长达几十个,但是这些tomcat的端口也都需要监控起来,如果手动添加的话将会非常麻烦,我们可以利用自动发现,将自动发现配置一些规则并做成模板,给有tomcat的服务器链接模板就可以了,这个过程就会大大减少人工的工作量2.在被控主机安装tomcat多实例2.1.安装tomcat[root@tomcat ~]# yum -y install java[root@tomca

2021-04-02 09:35:30 23

转载 7款不错的 CI/CD工具

时至今日,越来越多的工程团队开始实行敏捷开发,借以推动更短、更快的发布周期。而代码库的增长与更高的生产构建频率,也带动持续集成与持续部署/交付工具快速兴起。什么是CI / CD?其意义何在?在深入研究CI / CD自动化工具之前,我们首先需要了解其基本概念。正如我们所提到的,持续集成和持续部署通常与敏捷开发环境齐头并进。在这类环境中,团队希望在构建完成后立即将不同的代码段部署到生产环境中。JenkinsJenkins是CI市场中最知名且最常见的名号之一。其最初是由Sun公司的一位工程师打造的一.

2021-04-01 17:03:18 19

原创 zabbix自动化监控---自动注册机制(二十三)

zabbix自动监控之自动注册1.自动注册介绍zabbix自动发现的效率非常慢,每次自动发现的时候都需要对所有的主机进行扫描,也类似与zabbix被动模式,每次都需要向机器进行一次探测,比如这次某个主机没有存在,下次上线了又要重新扫描一次,效率非常低下。而zabbix自动注册的原理就类似主动模式,每次都是由zabbix-agent主动去向zabbix-server说我上线了,需要加入监控,这时zabbix-server同意后立马就加入监控了,这个效率是非常高的zabbix自动注册只需要配置四个地方即

2021-04-01 11:01:58 48 1

原创 zabbix自动化监控---自动发现机制(二十二)

zabbix自动监控之自动发现1.自动发现介绍当我们有上千台主机都需要加监控的时候用自动发现会非常方便,只需要我们创建一个自动发现规则,设置自动发现的范围,在根据设置的动作就可以将已经安装好agent的Linux服务器自动的添加到监控上注意:自动发现的主机必须事先安装zabbix-agent,因此自动发现的动作就是根据system.uname这个监控项的输出作为判断的,system.uname监控项就是检查有没有安装zabbix-agent安装zabbix-agent则会输出:[root@zab

2021-04-01 10:57:26 37

原创 zabbix主动模式与被动模式区别以及详细配置(二十一)

zabbix主动模式与被动模式1.zabbix主被动模式介绍被动模式:被动模式就是由zabbix server向zabbix agent发出指令获取数据, 即zabbixagent被动的去获取数据并返回给zabbix server, zabbix server周期性的向agent 索取数据, 这总模式的最大问题就是会加大zabbix server的工作量, 在数百台服务器的环境下zabbix server不能及时获取到最新数据, 但这也是默认的工作方式。主动模式是有zabbix agent主动采集数

2021-04-01 10:54:16 24

原创 zabbix使用snmp监控Linux主机(二十)

使用snmp监控Linux主机1.snmp协议介绍SNMP(简单网络管理协议)也是应用层的一种协议,默认端口号为161,我们平时监控Linux主机都是安装一个agent客户端进行监控,但是有的公司还需要监控网络设备和Windows主机,这时就不得不采用snmp协议去监控设备了SNMP有一个MIB库,这个MIB库中存储着每一个监控指标的oid,所谓oid就是object id对象id,每一个监控指标都会有一个oid,并且存放在MIB库中,保证所有监控指标的oid都不会重复举一个例子:例如CPU这个监控

2021-03-30 11:46:24 52 1

原创 zabbix使用percona插件监控mysql数据库(十九)

zabbix使用percona插件监控mysql数据库监控MySQL一般最常用的插件就是percona,percona一开始是cacti监控MySQL的插件,后来觉得还不错就打包了zabbix的版本percona插件下载地址为:https://downloads.percona.com/downloads/percona-monitoring-plugins/percona-monitoring-plugins-1.1.8/binary/redhat/7/x86_64/percona-zabbix-te

2021-03-30 11:41:07 2148 4

原创 蓝鲸自动化运维平台批量创建任务并设置定时

蓝鲸自动化运维平台批量创建任务并设置定时可以在作业平台进行配置1.新建作业1.1.进入作业平台1.2.点击新建作业1.3.设置作业名称1.4.编写脚本1.5.选择执行的服务器添加成功1.6.点击保存1.7.创建作业完成2.执行作业执行成功3.设置定时每天12点执行找到定时作业点击启动...

2021-03-30 11:21:27 17

原创 Jenkins美化---更新时日志输出带颜色

Jenkins更新输出日志改变颜色Jenkins默认输出日志不带任何字体颜色,除了问题不容易排错影响我们看log的时间1.安装日志颜色插件点击系统管理—插件管理—可选插件—搜索插件AnsiColor 点击安装即可2.配置项目开启日志颜色功能进入项目找到构建环境,点击 Color ANSI Console Output 即可开启3.配置项目执行的脚本定义颜色echo -e "\033[32m 更新目标:${target}\033[0m"echo -e "\033[32m 项目名称:${pro

2021-03-30 11:14:18 25

原创 zabbix监控应用页面访问速度并设置告警(十八)

zabbix创建web监测监控项并设置告警1.为什么要使用web监测web监测类似于一个监控项,可以监控一个站点的使用状态,原理就是通过curl命令去匹配对应的状态码并显示图像大致步骤就是:​ 1.首先创建web监测填写基本信息​ 2.然后创建步骤,步骤就是设置对某个页面进行web监测,要写状态码为200一定要勾选跟随跳转2.配置web监测2.1.创建web监测配置—主机—web监测—创建web监测点击创建web监测2.2.添加web场景信息名称:zabbix_html_sta

2021-03-26 10:18:12 28

原创 使用curl模拟登陆zabbix系统(十七)

使用curl模拟登陆zabbix任何模拟登陆都分为三步:​ 1.获取该网站的cookie,记录请求连接、请求数据​ 2.模拟登陆​ 3.验证最核心的思想就是浏览器怎么访问,我们也怎么访问带验证码的网站无法通过shell模拟登陆1.获取zabbix网站cookie值首先访问zabbix首页,按f12进入调试页面,故意输错一个密码,这样就能得到请求文件了1.1.获取URL地址请求文件如何找,这里教一个小妙招,每一个都点一遍,包含from data的就是http://192.168

2021-03-26 10:12:28 14

原创 centos部署discuz并使用redis加速

部署discuz并使用redis加速1.部署LNMP环境1.1.准备yum环境[root@jiangxl ~]# rm -rf /etc/yum.repos.d/*[root@jiangxl ~]# curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo ;curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/

2021-03-26 10:09:57 15

原创 k8s强制删除pod以及namespace

Kubernetes强制删除一直处于Terminating状态的pod和namespace强制删除podkubectl get po -n NAMESPACE |grep Terminatingkubectl delete pod tomcat-deployment-7db86c59b7-9dbn7 -n dev --force --grace-period=0强制删除namespace[root@k8s-master ~/k8s_1.19_yaml]# kubectl delete ns aa

2021-03-25 16:17:54 49

原创 Vsphere创建内容库Iso以及创建esxi虚拟机

Vcenter创建虚拟机1.创建iso内容库1)点击内容库2)点击+号创建内容库填写内容库名称3)配置内容库4)添加存储注意:这个存储必要要和对应的exsi使用同一个存储才可以识别5)完成2.克隆其他内容库iso镜像到新建的内容库1)找到内容库的镜像点击克隆2)选择克隆到希望的内容库,先点一下当前内容库在点目标内容库,等待完成即可3.创建虚拟机1)找到对应的esxi机器点击右键新建虚拟机2)创建新的虚拟机3)填写虚拟机名称4)选择要将虚拟机创建在哪台的es

2021-03-24 13:37:51 25

原创 kube-proxy支持的三种工作模式

kube-proxy支持的三种工作模式userspace模式userspace模式下,kube-proxy会为每一个service创建一个监听端口,用户请求首先发送给Cluster IP,然后由iptables规则重定向到kube-proxy监听的端口上,kube-proxy根据LB算法选择一个提供服务的pod并和其建立连接该模式下,kube-proxy充当了一个四层负载均衡器的角色,由于kube-proxy运行在userspace下,在转发的过程中会增加内核和用户空间之间的数据拷贝,虽然稳定但是效

2021-03-19 12:04:24 34

原创 使用zabbix监控php-fpm服务(十六)

使用zabbix监控php-fpm服务1.开启php-fpm状态监控1.开启php-fpm状态监控[root@192_168_81_220 ~]# vim /etc/php-fpm.d/www.confpm.status_path = /php_status2.配置nginx连接php-fpm[root@192_168_81_220 ~]# vim /etc/nginx/nginx.conf location /php_status { fast

2021-03-18 11:59:33 56

原创 使用zabbix监控nginx服务(十五)

使用zabbix监控nginx服务1.开启nginx状态监控1.安装nginx[root@192_168_81_220 ~]# yum -y install nginx2.开启状态监控页面[root@192_168_81_220 ~]# vim /etc/nginx/nginx.conf location /nginx_status { stub_status; }3.重启nginx[root@192_168_81_220 ~

2021-03-12 09:46:33 40

原创 zabbix自定义TCP 11种状态监控模板(十四)

zabbix自定义监控模板如果一直对多个主机同时增加监控项那么会非常麻烦,在实际生产中有很多时候我们都需要对一批机器同时增加多个相同的监控项,如果一个一个手动添加将会非常麻烦,因此就有了模板的诞生,我们只需要创建一个模板,让需要监控的主机链接模板即可我们先手动实现监控项的大规模创建,然后再做成模板我们以tcp11种状态为例进行添加监控项tcp11中状态ESTABLISHEDSYN_SENTSYN_RECVFIN_WAIT1FIN_WAIT2TIME_WAITCLOSECLOSE_WA

2021-03-12 09:23:42 36

原创 蓝鲸自动化运维平台

蓝鲸自动化运维平台1.蓝鲸简介官网:https://bk.tencent.com/docs/腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称 IEG)自研自用的一套用于构建企业研发运营一体化体系的 PaaS 开发框架,提供了 aPaaS(DevOps 流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI 等原子平台)等模块,帮助企业技术人员快速构建基础运营 PaaS。2.蓝鲸部署2

2021-03-11 15:04:40 178

原创 grafana增加dashboard图形(十三)

grafana增加dashboard很多公司的grafana都有特别多的dashboard,针对不同的业务做不同的监控图形今天来总结一下如何创建dashboard以CPU使用情况为例创建一个dashboard1.创建dashboard1.1.点击创建dashboard1.2.选择创建图形1.3.选择条形图1.4.增加监控项点击圆筒图标即可Group:知识点管理平台 //主机群组Host:/.*/ //主机群组中的所有主机,这里不能使用$hostApplication

2021-03-09 15:45:44 76

原创 配置grafana直连zabbix数据库(十二)

配置grafana直连zabbix数据库由于grafana都是通过zabbix取值最终展示在图形中,但是由于zabbix某些监控项可能获取值的时间较长,因此我们可以让grafana直连数据库进行直接取值,从而让展示的图形更加准确1.增加MySQL数据源点击配置—Data Source—Add data source选择MySQL填写MySQL数据库信息host:192.168.81.210database:zabbixuser:zabbixpassword:123456测试数据库是

2021-03-09 15:43:23 39 1

原创 zabbix利用grafana自定义监控图形展现(十一)

利用grafana实现监控图形展现1.修改已有的system load监控图像下面这张图是现在已经有的系统负载监控图,可以看到只有15分钟的负载并没有1分钟和5分钟的负载,我们现在修改一下图形,让他支持1分钟和5分钟的系统负载1.1.点击system load—edit1.3.填写监控项信息Group:$group //组信息Host:$host //主机信息Application:CPU //应用集item:Processor load (1 min average

2021-03-09 15:37:59 72 1

原创 k8s创建资源yaml报错排查思路

k8s创建yaml报错如何排查经验总结报错内容如下[root@k8s-master ~/k8s_1.19_yaml]# kubectl create -f pod-xiangxipeizhi.yamlerror: error validating "pod-xiangxipeizhi.yaml": error validating data: [ValidationError(Pod.spec.containers[0].env): invalid type for io.k8s.api.core.

2021-03-06 23:42:23 74

原创 配置zabbix连接grafana展示监控图形(十)

zabbix连接grafana1.安装grafana1.获取grafana rpm包[root@zabbix-server ~]# wget https://dl.grafana.com/oss/release/grafana-6.3.0-1.x86_64.rpm2.安装grafana[root@zabbix-server ~]# yum -y localinstall grafana-6.3.0-1.x86_64.rpm3.启动grafana并设置开机自启[root@zabbix-se

2021-02-23 13:53:42 99 2

原创 AlertManager实现企业微信报警(十三)

AlertManager实现企业微信报警1.AlertManager对接企业微信ALertManager支持的报警方式有邮件报警、钉钉报警、微信报警,本次将实现企业微信报警2.企业微信配置2.1.注册一个企业微信2.2.创建一个报警机器人在应用管理点击创建应用即可2.3.创建部门注册完企业微信就会有一个部门2.4.记录重要信息用于配置1、记下企业id号在我的企业—最下面就会有企业idww48f74fc8ed3a07ba2、记录部门id号部门id为13、记录机器人i

2021-02-23 13:49:19 137

原创 Alertmanager告警规则编写案例(十二)

alertmanager告警规则编写案例1.编写告警规则注意事项首先要将一些类似的监控项规划到一个分组,在定义表达式、告警级别、告警详细内容,在告警详细内容中一定要熟练使用监控项自身的标签,这样就可以在告警内容中让管理员一眼知道什么触发了告警2.编写磁盘告警规则2.1.编写规则expr指定表达式,在使用逻辑符号匹配阈值告警内容中要熟练运用各种标签,标签都是监控项中自带的,value标签就是当前监控项的一个指标[root@prometheus-server /data/prometheus]#

2021-02-23 13:46:33 115

原创 AlertManager告警收敛(十一)

AlertManager告警收敛1.告警分组分组就是将类似性质的警报分类为单个通知,比如服务器宕机、应用挂掉,这种类型的告警可以分到一个组中,分到一个组时,当同一时间内触发了多条告警,这时都会发送到同一封邮件中,可以避免因告警邮件太多而忽视了重要信息。这封邮件就很好的说明了这个分组的意义由于prometheus编写的规则是对所有服务器生效的,因此所有服务器仅需要创建一个类型的报警即可,当同一时间段多台主机触发了这个告警,则会同时向管理员发送一条报警邮件,同种类型告警主要是以alertname来区分的

2021-02-09 23:22:18 83

原创 AlertManager告警分配路由配置(十)

AlertManager告警分配路由配置1.route路由配置文件介绍route: group_by: ['alertname'] //定义分组 group_wait: 10s //分组等待时间 group_interval: 10s //收到告警后多长时间发送给接收者 repeat_interval: 10m //重复告警间隔 receiver: 'yunwei' //默认邮箱 routes: //启

2021-02-09 23:21:47 189

原创 AlertManager监控报警神器(九)

prometheus+AlertManager实现监控报警1.AlertManager简介prometheus自身不具备报警能力,因此需要结合第三方报警程序来实现监控指标告警AlertManager是一款不错的告警程序,首先由prometheus配置告警规则,当告警规则触发后,会把告警信息推送给altermanager,AlertManager收到告警之后在根据配置的路由,根据报警级别不同分别发送给不同的receive(收件人),AlertManager可以实现email、企业微信等报警2.部署A

2021-02-09 23:19:10 217

原创 prometheus监控mysql服务器(八)

prometheus监控mysql服务器1.利用mysql_exporter监控mysql主机环境准备IP服务192.168.81.210prometheus、grafana192.168.81.220mysql192.168.81.230mysql1.1.安装配置mysql在装有mysql的两台机器上执行1.安装mysql[root@192_168_81_220 ~]# yum -y install mariadb2.启动mysql[root@

2021-02-09 23:00:34 56

原创 prometheus配合grafana监控图形展现(七)

prometheus+grafana监控图形展现1.grafana部署1.安装[root@192.168.81.210 ~]# rpm -ivh grafana-6.3.2-1.x86_64.rpm 警告:grafana-6.3.2-1.x86_64.rpm: 头V4 RSA/SHA1 Signature, 密钥 ID 24098cb6: NOKEY准备中... ################################# [100%]正在

2021-02-09 22:59:01 70

原创 prometheus使用node_exporter监控Linux主机CPU、内存、磁盘、服务运行状况(六)

prometheus使用node_exporter监控Linux主机1.node_exporter简介node_exporter常用于系统监控,使用go语言编写的指标收集器node_exporter操作文档:https://prometheus.io/docs/guides/node-exporter/prometheus支持的exporters列表:https://prometheus.io/docs/instrumenting/exporters/2.部署node_exporter环境准备

2021-02-03 10:17:06 554

原创 prometheus基于文件的服务自动发现(五)

prometheus基于文件的服务发现1.prometheus支持的服务发现来源azure_sd_configsconsul_sd_configsdns_sd_configsec2_sd_configsopenstack_sd_configsfile_sd_configsgce_sd_coonfigskuberneters_sd_configsnerve_sd_configsserverset_sd_configstriton_sd_configs2.环境准备IP角

2021-02-03 10:12:56 102

原创 prometheus relabel_configs配置介绍及使用(四)

relabel_configs配置介绍及使用1.relabel_configs重新标签1.1.重新标签的意义重新标签就是重新定义一个标签relabel_configs:这个配置项允许在采集之前对任何目标及标签进行修改重新标签的意义:重命名原来的标签、删除标签、过滤目标,可以针对标签的某个值进行过滤在查询一个监控指标时,prometheus会把只要包含这个监控指标的所有监控数据都列出来,这样看起来也是很麻烦,不过我们可以在查询时指定一个标签,这样就可以定位到指定的主机上relabel_confi

2021-02-03 10:10:42 79

原创 prometheus配置文件介绍(三)

prometheus配置文件与核心功能配置文件官方文档:https://prometheus.io/docs/prometheus/latest/configuration/configuration/1.全局配置文件介绍global: [ scrape_interval: <duration> | default = 1m ] //多久时间探测一次数据 [ scrape_timeout: <duration> | default = 10s ] //

2021-02-03 10:08:03 36

mysql监控模板json格式

mysql监控模板json格式

2020-12-22

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除