![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
prometheus
文章平均质量分 57
爷来辣
个人笔记,快乐运维。
展开
-
[问题已处理]-在win10上安装prometheus监控
win10原创 2022-08-27 13:27:20 · 547 阅读 · 0 评论 -
[prometheus]-node-exporter通过textfile上报数据
导语:需要获取cpu频率和温度并上传到prometheus启动参数查看node-exporter的github描述,node-exporter启动的时候指定–collector.textfile.directory=/opt/exporter/node_exporter/key 即可, 这个参数会解析指定目录下的所有以prom结尾的文件.即:我们只需要把自定义脚本的输出Metrics数据写入到指定目录下的文件,并以Prom结尾即可, Prometheus在定时采集node exporter获取数据的原创 2022-04-03 21:44:47 · 1750 阅读 · 0 评论 -
[kubernetes]-两大grafana插件配合prometheus使用
导语:想再grafana上监控k8s提前部署node_exporter这个之前部署过了提前部署kube-state-metrics创建kube-state-metrics.json{ "apiVersion": "apps/v1", "kind": "Deployment", "metadata": { "name": "kube-state-metrics", "namespace": "kube-system" }, "spec": { "selec原创 2021-03-26 16:48:24 · 529 阅读 · 1 评论 -
[kubernetes]-使用DaemonSet部署node_exporter监控systemd服务
导语:想要监控pods及k8s-node的情况因为日志是挂载在node节点上的,需要上传到第三方。就没有用filebeat做sidecar收集了。就做了一个filebeat的systemd服务 担心各个systemd服务有问题,因此需要node_porter加入对systemd的监控。cAdvisor已经内置在了 kubelet 组件之中,所以我们不需要单独去安装它来监控容器。在prometheus添加targets就可以了 - job_name: 'kubernetes-cadvisor'原创 2021-03-25 16:28:17 · 2111 阅读 · 0 评论 -
[kubernetes]-k8s安装alertmanager和prometheus-webhook-dingtalk
安装alertmanager创建存放数据及插件的文件夹# 在指定的node上创建文件夹mkdir -p /data/k8s/alertmanagerchown -R 65534:root alertmanager 创建alertmanager-cm.yaml---apiVersion: v1kind: ConfigMapmetadata: name: alertmanager-config namespace: kube-opsdata: alertmanager.ym原创 2021-03-25 16:26:25 · 1970 阅读 · 0 评论 -
[kubernetes]-k8s安装grafana
创建存放数据及插件的文件夹# 在指定的node上创建文件夹mkdir -p /data/k8s/grafanachown -R 472:root grafana # 这里不授权会报错# GF_PATHS_DATA='/var/lib/grafana' is not writable.# mkdir: can't create directory '/var/lib/grafana/plugins': Permission denied# 安装插件也会报错创建grafana-cm.yam原创 2021-03-25 16:23:27 · 2436 阅读 · 0 评论 -
[kubernetes]-k8s安装prometheus
导语:后续服务需要上k8s,会存在docker和k8s共存的情况,部署在集群外的prometheus不方便获取k8s pod的相关信息,也想把prometheus加入k8s生态中,创建一个名为kube-ops的namespcaekubectl create ns kube-ops创建prometheus的config文件prometheus-cm.ymlapiVersion: v1kind: ConfigMapmetadata: name: prometheus-config nam原创 2021-03-25 16:22:25 · 666 阅读 · 0 评论 -
[kubernetes]-prometheus开启动态加载
导语:使用命令curl -X POST http://localhost:9090/-/reload 或者kill -HUP pid 重新加载配置文件,会报错Lifecycle API is not enabled。经常修改配置,刚刚重启完,target都是unhealthy的。开启Lifecycle API修改/etc/systemd/system/prometheus.service添加--web.enable-lifecycle 启用选项systemctl daemon-reloadsys原创 2021-03-25 16:21:52 · 798 阅读 · 0 评论 -
[kubernetes]-node_exporter启动参数
导语:今天重新学习了一下prometheus发现 node_exporter中的有些参数比较好用。如以下2个参数–collector.systemd 可用于监控系统服务–collector.vmstat.fields=^(oom_kill|pgpg|pswp|nr|pg.fault). 我看中这个oom1.0.1 版本的node_exporter 是这样的--collector.systemd.unit-whitelist=".+"原创 2021-03-25 16:19:12 · 2027 阅读 · 0 评论 -
[prometheus]-prometheus磁盘趋势告警
prometheus 磁盘趋势告警个把月前在b站看到老哥itcooking的视频 测试了一下,一直没用上。做个笔记先。predict_linear(node_filesystem_avail_bytes{device="/dev/mapper/bg00-lvroot",mountpoint="/",nodename="monitor01"}[4h],24*3600)/(1024*1024*1024)# 我自己是jobname的 所以最好根据自己的情况执行node_filesystem_avail_原创 2020-09-05 10:23:58 · 1614 阅读 · 0 评论 -
[prometheus]-删除指定Metric
如图 需要删除 http://linux.xujiamin.com 的所有数据查看metrics里的信息删除 Metric probe_http_status_code 和 instance为 http://linux.xujiamin.com"的数据curl -X POST -g 'http://localhost:3000/prometheus/api/v1/admin/tsdb/delete_series?match[]=probe_http_status_code{instance="原创 2020-06-06 10:14:01 · 3271 阅读 · 0 评论 -
[prometheus]Step12-prometheus配置black_exporter告警
起因是因为url 监控并没有配置告警策略,基本上就是靠看图。达不到监控告警的意义。# HELP probe_dns_lookup_time_seconds Returns the time taken for probe dns lookup in seconds# TYPE probe_dns_lookup_time_seconds gaugeprobe_dns_lookup_time_seconds 0.000614409# HELP probe_duration_seconds Return原创 2020-06-06 10:11:55 · 1730 阅读 · 0 评论 -
[prometheus]Step11-prometheus动态监控服务器端口并告警
办法比较捞~办法比较捞~办法比较捞~有大佬有好的方法或者现成的代码提供小弟感激不尽!!之前zabbix做了动态监控服务器上端口监控的告警,换到prometheus 暂时还没有发现怎么做。因为有些端口新起的话 不想手动加到prometheus的配置里。于是先用比较捞的方法,用一个8080的nginx 端口通过静态页面,ip:8080/metrics 提供给prometheusup用来表示8080端口健康情况downports 为1表示端口正常 非1的话为不正常,并通过value把故障的por原创 2020-06-06 10:11:43 · 3919 阅读 · 0 评论 -
[prometheus]Step10-prometheus使用grafana的alert告警监控docker容器
prometheus 使用grafana的alert告警监控docker容器接上一篇。由于grafana只支持图表告警,所以想要使用它的alert告警,需要专门创建一个视图。剩余可用内存内存使用率修改参数点击小齿轮[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bQvtPuGC-1591409337788)(https://gitee.com/jiaminxu/BlogImage/raw/master/img/20200602161152.png)]选原创 2020-06-06 10:10:02 · 679 阅读 · 0 评论 -
[prometheus]Step9-prometheus+cadvisor监控docker容器
prometheus+cadvisor监控docker容器首先在docker宿主机上安装cadvisordocker通过cadvisor监控 在宿主机上使用如下命令 可以直接通过ip+port 进入cadvisor的web界面查看docker run -d -it -v /:/rootfs:ro -v /var/run:/var/run:rw -v /sys:/sys:ro -v /var/lib/docker/:/var/lib/docker:ro -p 8080:8080 --detach=t原创 2020-06-06 10:09:37 · 473 阅读 · 0 评论 -
[prometheus]Step8-修改alertmanager默认告警邮件中的url地址
先上图 看了效果再看步骤不建议使用qq邮箱接收告警邮件。url请求会被拦截在/usr/lib/systemd/system/alertmanager.service中加入–web.external-url=http://ip(或者域名):9093如下在/etc/systemd/system/prometheus.service下加入–web.external-url=http:...原创 2020-04-04 11:03:36 · 1304 阅读 · 1 评论 -
[prometheus]Step7-prometheus使用阿里云企业邮箱告警
prometheus使用阿里云企业邮箱告警修改/data/alertmanager/alertmanager.yml 加入邮件配置# 全局配置项global: resolve_timeout: 5m # 处理超时时间,默认为5min smtp_from: 'seafile@pdabc.com' smtp_smarthost: 'smtp.mxhichina.com:465' ...原创 2020-04-04 11:03:04 · 686 阅读 · 0 评论 -
[prometheus]Step6-prometheus使用钉钉告警
prometheus 使用钉钉告警安装alertmanager.servicecd /opt# wget https://github.com/prometheus/alertmanager/releases/download/v0.20.0/alertmanager-0.20.0.linux-amd64.tar.gztar -xvf alertmanager-0.20.0.linux-a...原创 2020-04-03 13:47:41 · 46293 阅读 · 4 评论 -
[prometheus]Step5-blackbox_exporter
[prometheus]-blackbox_exporterblackbox_exporter如Github中介绍所说的,可以做http,https,tcp,icmp,DNS等探测cd /optwget https://github.com/prometheus/blackbox_exporter/releases/download/v0.16.0/blackbox_exporter-0.1...原创 2020-04-03 13:47:03 · 897 阅读 · 0 评论 -
[prometheus]Step4-node_exporter注册到consul
prometheus+consul+node_exporter修改prometheus.ymlglobal:alerting: alertmanagers: - static_configs: - targets:rule_files:scrape_configs:# - job_name: 'prometheus'是监听prometheus服务本身 - job_n...原创 2020-04-03 13:46:11 · 2127 阅读 · 0 评论 -
[prometheus]Step3-centos7 安装consul
Prometheus是一个开源的服务监控系统,它通过HTTP协议从远程的机器收集数据并存储在本地的时序数据库上。多维数据模型(时序列数据由metric名和一组key/value组成)在多维度上灵活的查询语言(PromQl)不依赖分布式存储,单主节点工作.通过基于HTTP的pull方式采集时序数据可以通过push gateway进行时序列数据推送(pushing)可以通过服务发现或者静...原创 2020-04-03 13:45:40 · 292 阅读 · 0 评论 -
[prometheus]Step2-centos7prometheus添加node_exporter节点
centos7 prometheus添加node_exporter节点在iZbp13nwyvib50dibue9opZ这台上安装node_exporterNODE_PATH='/data/prometheus/node_exporter/'cd /usr/local/src/mkdir -p ${NODE_PATH}# wget https://github.com/prometheu...原创 2020-04-03 13:45:20 · 1050 阅读 · 0 评论 -
[prometheus]Step1-centos7安装prometheus+node_exporter+grafana
centos7 安装prometheusPROM_PATH='/data/prometheus'mkdir -p ${PROM_PATH}mkdir -p ${PROM_PATH}/{data,conf,logs,bin}useradd prometheuscd /usr/local/srcwget https://github.com/prometheus/prometheus/r...原创 2020-04-03 13:44:11 · 321 阅读 · 0 评论