Zabbix监控流量异常（偶尔超出交换机限制）

最新推荐文章于 2024-09-18 12:12:00 发布

南宫乘风

最新推荐文章于 2024-09-18 12:12:00 发布

阅读量2.2k

点赞数 1

分类专栏： Zabbix监控错误问题解决文章标签： zabbix 问题流量

未经本人允许，禁止转载，谢谢合作南宫乘风

本文链接：https://blog.csdn.net/heian_99/article/details/119825171

版权

错误问题解决同时被 2 个专栏收录

15 篇文章 9 订阅

订阅专栏

9 篇文章 3 订阅

订阅专栏

博客讲述了在业务流量正常情况下，Zabbix监控显示网卡流量异常增大的问题。通过使用ifstat工具进行实时监控及SNMP进行对比，发现Zabbix数据存在偏差。问题根源在于监控项抓取频率过高，导致数据积压。调整抓取间隔至1分钟解决了问题，确认无虚假流量并恢复正常监控。

摘要由CSDN通过智能技术生成

前提：

近期业务做了集群的流量汇总，整体没有问题。后面慢慢优化一些参数项。但是这两天发现，集群流量数据增大，业务正常。

问题：

zabbix和prometheus 监控网卡，流量异常增大，超出限制，每次2分钟，偶尔性触发

看图，这个和7月对比，简介翻了几倍，但是业务没有增长，这就很奇怪了

上面介绍相关截图。

解决：

首先以为业务导致网卡过大加载，导致流量增大，我们使用 ifstat-1.1.tar.gz 工具记录每一秒的网卡速度，记录一晚上再看。

分析上图，虽然流量有超过100M的，但是网卡是能够支撑的。没有zabbix和prometheus显示的那么恐怖。

思考

我和大佬分交流一下。说是zabbix的单位转换，要加8倍，我也是添加了的

嗯。。。。。。。。。。。。。。。。。。。。。正常

大佬建议让我使用snmp监控对比一下，思路不错，可以搞。直接部署上去对比了

分析

snmp对比一下

zabbix的（还是这么高）

snmp的（这个是正常的）

很明显，这是snmp是准确的。但是为什么会这样

结果：

首先，业务正常，服务器正常，现在就是zabbix不正常，怀疑是zabbix的问题

回想一下，在数据量增加前做了什么操作。

之前，我当时增加一批监控指标，因为监控点比较重要，所有设置抓取时间为10s。谁知道这个10s就是罪魁祸首。集群内部机器较多，可能会产生数据积压。

后续

取消关联模板，监控整体流量，确定无虚假流量

调整监控项的抓取指标为：1m 再次关联模板正常

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄7年

运维领域新星创作者

博客专家认证

394
原创

1193
点赞

3423
收藏

1万+
粉丝

关注

私信

分类专栏

最新评论

Ingress配置优化和追踪
i520c_and: 添加的初始化容器 init-sysctl 用于在 Ingress Nginx 控制器 Pod 启动之前执行一些系统级参数的优化。这些参数通过 sysctl 命令进行设置，主要用于调整 Linux 内核的网络和文件系统行为，以提高性能和资源利用率。以下是每个参数的详细解释： mount -o remount rw /proc/sys 这个命令重新挂载 proc 文件系统下的 sys 目录为读写模式。因为默认情况下，/proc/sys 是只读的，这个步骤是必要的，以便后续可以修改内核参数。 sysctl -w net.core.somaxconn=65535 net.core.somaxconn 参数定义了 TCP 套接字监听队列的最大长度。增加这个值可以允许更多的连接请求在被服务处理之前排队等待。默认值通常较低，增加它可以提高处理大量并发连接的能力。 sysctl -w net.ipv4.ip_local_port_range="1024 65535" net.ipv4.ip_local_port_range 参数定义了用于向外连接的本地端口范围。默认情况下，这个范围是从 32768 到 60999。将其设置为从 1024 到 65535 可以提供更多的端口供服务使用，这在高负载环境下特别有用。 sysctl -w net.ipv4.tcp_tw_reuse=1 net.ipv4.tcp_tw_reuse 参数允许重用处于 TIME_WAIT 状态的套接字。TIME_WAIT 状态是 TCP 连接关闭过程中的一个阶段，通常持续 60 秒。允许重用这些套接字可以更快地重新使用这些资源，特别是在短连接的应用中。 sysctl -w fs.file-max=1048576 fs.file-max 参数设置了系统可以打开的最大文件数量。增加这个值可以允许系统同时打开更多的文件，这对于高并发的服务来说是一个重要的优化。 sysctl -w fs.inotify.max_user_instances=16384 fs.inotify.max_user_instances 参数设置了每个用户可以创建的 inotify 实例的最大数量。inotify 是 Linux 提供的一种文件系统事件监控机制。增加这个值可以允许更多的并发监控。 sysctl -w fs.inoti
zabbix-api查询机器资源利用率，导出execl表格
宝子们: 有没有方法可以自己设置需要导出的群组的，而不是所有的服务器
Confluence升级方案
Mlxg2234: 我破解之后confluence咋就起不来了
Python调用Jumpserver的Api接口增删改查
实习的骑象人: jms3开始内置Prometheus了？
Promethus的Grafana图形显示MySQL监控数据
南宫乘风: 在Grafan的设置配置 Prometheus的地址，就可以修改源。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

南宫乘风 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。