prometheus
文章平均质量分 84
对你无可奈何2008
境來不拒,境去不留。隨緣自適,心無增減.
展开
-
K8S exporter应用
exporter对于云服务的监控还是很不完美,毕竟每家都有自己的护城河。自动发现多实例这样的借助consul 阿波罗这样的会简单一些。aws可以借助cloudwatch这样的导入模板到grafana中。还是希望能将类似腾讯云云监控中的这些指标采集到prometheus中,但是这过程应该还很遥远grafana出图 prometheus查询语法这些东西有时间的好好研究一下。报警有必要进行分级别,收敛配置一下!原创 2023-07-14 10:42:26 · 940 阅读 · 0 评论 -
对远程http服务的拨测体验
过程是这样的,需要与合作方数据进行交互(肯定是不允许直接连对方数据源的),对方提供了两台server,后端同事在server上面作了proxy搭建了桥接的应用(两台server没有公网ip,通过一个超级难用的堡垒机明御进行管理)。两台server挂在在了负载均衡slb上对外提供http服务(环境为阿里云环境)。项目马上要上线了,然后就面临一个问题,如何监控这个桥接程序的健康状态呢?想到了几种方式:1 .云商的拨测服务:比如腾讯云的云拨测(2.还搜到了开源的项目。原创 2023-05-30 20:17:50 · 539 阅读 · 0 评论 -
Prometheus跨集群采集
现实环境中我应该不会那么玩,还是跟原来一样,每个k8s集群搞一个prometheus-oprator集群,然后可以连接一个grafana…其实那么的搞了一圈玩一下就发现了K8s1.24 后。原创 2022-09-08 17:07:31 · 725 阅读 · 0 评论 -
Kubernetes prometheus Job误报解决
背景:基本就是这样的环境:TKE 1.20.6搭建Kube-Prometheus(prometheus-oprator,做了一个cronjob:Kubernetes Cronjob的第一次使用。更新版本时候job发生了异常。但是后来都恢复了。可是alertmanager一直报警:相当惹人烦。该怎么处理呢?Kubernetes prometheus Job误报解决1. 暴力方式-删除失败的job![root@k8s-master-01 manifests]# kubectl get job -n原创 2022-04-07 11:51:37 · 617 阅读 · 0 评论 -
TKE 1.20.6搭建Kube-Prometheus(prometheus-oprator)
背景:线上开通了tke1.20.6的集群。嗯腾讯云有个原生的Prometheus的监控,开通了使用了一下。不过我没有怎么玩明白。文档也不全。还是想了下自己手动搭建一个Prometheus-oprator吧!基本过程基本参照:Kubernetes 1.20.5 安装Prometheus-Oprator。下面讲一下不一样的和需要注意的过程以及基本注意的:1.前提重复操作1.1-1.4操作基本保留都没有问题!2. 添加 kubeControllerManager kubeScheduler监控访问原创 2021-08-10 10:47:21 · 446 阅读 · 0 评论 -
Kubernetes集群安装kube-prometheus后无法执行kubectl top node
背景:Kubernetes 1.20.5 安装Prometheus-Oprator嗯,我的集群是1.21.3了虽然是…执行kubectl top nodes如下:解决问题过程:网上一堆各种说法的,但是没有一个是适用于我的。把monitoring下所有的pod的日志看了一个遍,然后在prometheus-adapter中发现日志如下:嗯想起来了我的集群都不是默认的cluster.local!如果有跟我一样自定义命名集群的需要注意修改这个这个配置!然后找一下配置文件中哪个文件有此项配置:比较笨原创 2021-07-31 11:29:02 · 675 阅读 · 0 评论 -
Kubernetes 1.20.5 upgrade1.21.0后遗症
前因后果:1. 升级后的报警Kubernetes 1.20.5 upgrade 1.21.0,升级完成突然发现Prometheus discover中两个服务down了,收到微信报警登陆Prometheus控制台一看controller-manager kube-scheduler服务确实是down:2. 查看服务状态确认相关服务是正常状态登陆集群查看kubectl get pods -n kube-system服务都是正常的。当然了也可以kubectl logs -f $podname -原创 2021-05-14 10:06:04 · 288 阅读 · 0 评论 -
日志服务CLS对接Grafana
背景:腾讯云CLB(负载均衡)与CLS(日志服务)集成。然后看日志服务CLS专栏有一篇CLS 对接 Grafana的博文。个人就也想尝试一下。当然了我的grafana是 Prometheus-oprator方式搭建在kubernetes集群中的。详见:https://cloud.tencent.com/developer/article/1807805。下面开始记录下自己搭建的过程一. Grafana中的配置参照https://cloud.tencent.com/developer/articl原创 2021-04-16 14:31:29 · 401 阅读 · 0 评论 -
Prometheus Operator 监控 Traefik V2.4
背景:traefik搭建方式如下:https://www.yuque.com/duiniwukenaihe/ehb02i/odflm7 。Prometheus-oprator搭建方式如下:https://www.yuque.com/duiniwukenaihe/ehb02i/tm6vl7。Prometheus的文档写了grafana添加了traefik的监控模板。但是现在仔细一看。traefik的监控图是空的,Prometheus的 target也没有对应traefik的监控。现在配置下添加tr原创 2021-04-06 20:52:33 · 372 阅读 · 0 评论