prometheus监控
文章平均质量分 52
运维开发小白丶
无人扶我青云志,我自踏雪至山巅。
日拱一卒,功不唐捐。加油向未来!
展开
-
python实现consul的服务注册与注销
我在使用consul的时候主要用于prometheus的consul服务发现,把数据库、虚拟机信息发布到consul,prometheus通过consul拿到数据库、虚拟机信息去采集指标信息。此篇文章前提是已经安装好consul服务以后,安装consul请参考进行安装。原创 2024-08-02 17:01:46 · 306 阅读 · 0 评论 -
python实现自动更新prometheus规则
由于公司需要监控目标类型较多,不能手动去改动prometheus规则然后reload,所以就通过python写了个程序自动更新prometheus配置基本环境准备基本流程以上为开发流程,在基本环境准备好的前提下开始开发,本文涉及的kevin模块导入均为本人开发功。原创 2024-07-15 11:19:32 · 631 阅读 · 0 评论 -
运维开发小白学习之路
作为一个开发转开发运维过程的小白学习之路,持续更新ing…原创 2024-07-09 15:16:52 · 479 阅读 · 0 评论 -
二进制方式部署consul单机版
【代码】二进制方式部署consul单机版。原创 2024-06-28 16:47:00 · 359 阅读 · 0 评论 -
thanos实现prometheus高可用部署
最近公司需要新建监控平台,本文做thanos的prometheus高可用实验,实现如下图。原创 2024-06-14 16:43:59 · 372 阅读 · 0 评论 -
运维监控系统
做监控系统集成,持续更新ing。原创 2024-06-14 16:03:24 · 993 阅读 · 0 评论 -
VictoriaMetrics的高可用二进制方式部署
mkdir -p /root/victoria_metrics/vmstorage-data #生产环境建议换成磁盘目录,换性能更好的ssd硬盘,集群所有节点都要执行。涉及机器列表,机器均为本地虚拟机。同步启动文集到其他节点。同步启动文集到其他节点。同步启动文集到其他节点。原创 2024-06-14 16:01:25 · 668 阅读 · 0 评论 -
grafana使用mysql远程存储
最近公司需要单独部署一套grafana集群,这是就需要集群内的grafana的数据保持一致,grafana支持mysql远程存储,我就使用mysql做了远程存储测试。grafana的配置文件grafana.ini修改。,此文章只做远程存储部分说明。grafana部署请参考。配置完重启容器即可。原创 2024-06-14 15:40:13 · 183 阅读 · 0 评论 -
grafana的admin密码忘记了
【代码】grafana的admin密码忘记了。原创 2024-06-14 15:33:29 · 423 阅读 · 0 评论 -
docker安装grafana
分析上述环境变量信息得知,需要把容器内的/etc/grafana、/var/lib/grafana、/var/log/grafana三个目录挂载到宿主机上以确保数据不随容器的停止而消失。容器创建成功之后,可直接通过3000端口访问grafana页面。原创 2024-06-14 15:28:08 · 228 阅读 · 0 评论 -
docker部署prometheus
容器部署的prometheus在执行热加载的时候没有生效,二进制部署就不会出现。原创 2024-06-14 15:18:03 · 192 阅读 · 0 评论 -
k8s安装prometheus
方法二:热加载速度比较慢,可以暴力重启 prometheus,如修改上面的 prometheus-cfg.yaml 文件之后,可。prometheus 的 pod 调度到哪个节点上,我们这里让 nodeName=k8s-node1,也即是让 pod 调度到。通过上面可以看到 service 在宿主机上映射的端口是 32138,这样我们访问 k8s 集群的 k8s-node1 节点。k8s-node1 节点上,因为 k8s-node1 节点我们创建了数据目录/data,所以大家记住:你在 k8s。原创 2024-01-11 16:03:49 · 1310 阅读 · 0 评论 -
k8s部署node-exporter
node-exporter介绍:node-exporter 可以采集机器(物理机、虚拟机、云主机等)的监控指标数据,能够采集到的指标包括 CPU, 内存,磁盘,网络,文件数等信息。原创 2024-01-11 10:34:48 · 817 阅读 · 0 评论 -
Unexpected response code: 429 (Your IP is issuing too many concurrent connections, please rate limit
最近监控系统新上了一组pg数据库,但是发现自动部署的exporter状态是正常的,metrics访问接口是正常的,prometheus和exporter机器网络也是通的,但是prometheus查询不到export状态。错误,经过查询发现这个错误就是prometheus服务发现请求consul次数超过consul默认的200限制导致的。而我们系统是通过配置映射挂载在consul容器上,于是我修改了consul挂载的配置映射congfigMap。在配置启动配置consul.json中添加。原创 2023-10-12 09:55:28 · 966 阅读 · 0 评论