prometheus
文章平均质量分 83
运维之美@
运维工程师,喜欢IT技术,每天学习一点,让我们一起进步吧
展开
-
一次TCP TIME_WAIT连接数过多告警处理
客户环境上在业务高峰期的时候,突然收到主机的TCP time_wait连接数告警过多的告警。运维侧及时介入分析,通过本文的处理方式和思路,希望给你在问题处理过程中提供灵感。原创 2024-01-20 18:51:25 · 1023 阅读 · 0 评论 -
破案现场:Docker容器资源限制导致的oom问题
在docker中可以对容器应用程序的资源进行限制,通过cgroup来控制容器,以确保它们在运行时不会占用过多的系统资源。由于主机节点较多,监控指标越来越多,prometheus当初定义的内存已经不够使用了,那么解决方案要么是优化上报的数据,另外一个就是增加放宽内存限制。内存限制:可以使用 --memory 或 -m 选项来限制容器可以使用的内存。CPU 限制:可以使用 --cpus 选项来限制容器可以使用的 CPU 核数。网络带宽限制:可以使用 --network 选项来限制容器的网络带宽。原创 2023-11-25 15:07:40 · 241 阅读 · 0 评论 -
prometheus怎么增加身份认证
前言:prometheus默认是没有用户密码登录认证的,对于部分环境可能会存在受攻击风险,那么怎么实现用户密码的身份验证呢?执行docker-compose up -d启动prometheus。修改prometheus的docker-compose配置文件。登录prometheus验证,已经成功添加密码认证了。vim新建文件basic_auth.yaml。3、增加密码认证的启动配置。2、增加身份认证配置文件。1、对密码进行哈希处理。执行脚本,生成加密密码。微信公众号:运维之美。原创 2023-08-04 23:19:42 · 1125 阅读 · 0 评论 -
Prometheus配置企业微信报警
Prometheus配置企业微信报警更多技术博客,请关注微信公众号:运维之美Prometheus被号称是下一代的监控,可以解决云上K8S集群的监控问题,搭配部署alertmanager,可以实现告警发送,本篇我们就通过企业微信实现告警发送,运维小哥可以躺平了。环境:prometheus服务端和alertmanager部署在同一台机器上,实验前提是prometheus服务端已经安装好操作系统:Centos7.4prometheus的告警管理分为两部分。通过在prometheus服务端设置告警规则原创 2021-09-03 21:46:22 · 5909 阅读 · 22 评论