视图 count慢_NPM视图延迟/无数据排查(1)

概述

本文介绍NPM页面出现延迟或者没有数据的情况的排查步骤和可能问题的解决方法。

知识点

NPM的数据流向和各功能的数据来源如下图:

5d6119074fe42dc7cc74689f63a1d118.png

排查和解决方案

数据延迟或者无数据的排查方向:

pktminer→ dp→ worker→ exporter

首先要找到【延迟初始的时间点】,即DP最初堵满的时间或NPM最初延迟的时间

如果是无数据,请先确认npm/npmweb/smartprobe console是否有进程异常

  1. pktimer:通常pktminer存包是不会出现延迟现象的,如果存包性能不够查看/opt/smartprobe/var/log/pktminer_v2_stderr.log会有IODrop,如果有IODrop参考【高性能版SmartProbe IODrop调优方案】

  2. dp:smartprobe服务器上执行>spcd dplog,查看dp_default-cache.log,查看是卡在哪个环节

    1.  如果卡在exportPkts环节,那么是卡在输出到NPM,需要后续排查NPM是哪里卡,参考步骤#3和#4

    2.  如果是卡在前面ntrPkts和ntaPkts,那么是dp处理数据处理不过来,需要调整dp参数或者减小流量

      1. 卡在ntrPkts:减小/opt/smartprobe/etc/system/local/dp.xml中max_flow_count的值

      2. 卡在ntaPkts:减小/opt/smartprobe/etc/system/local/dp.xml中各nta.group中max_unit_count的值

  3. worker:主要查看/opt/npm/var/log/vp_worker_ethx_stderr.log

    1.  查看当前处理的ts时间和系统时间是否有延迟,如果有延迟且top中各worker进程占用cpu接近100%,可能是worker处理不过来,需要增加worker数量(/opt/npm/etc/system/local/dataflow.xml)

    2.  lowcap表示链路视图和设备视图的数据,spv表示服务路径图的数据

    3.  判断是否为worker的问题可以结合#4中exporter的日志

0f1046e57b0f307fcf1e8f8d09d33212.png

exporter:主要查看/opt/npm/var/log/vp_exporter_ethx_stderr.log

  1.  查看elapsed时间是否很长,如果很长,则是插入mongo慢,插入mongo慢有两种可能:

    1. mongo当前有大量慢操作,有长时间的查询

    2. 插入mongo的数据量过大导致exporter处理不过来:减小dp.xml中runtime.nta.group.target=worker的max_unit_count的值

  2.  exporter中可以看到收到worker的数据的ts,如果收到的ts时间和日志中系统时间相差很大,则worker处理很慢,参考#3

  3. bcb16d936e901894a7bb135af1d94f77.png

如果视图数据不延迟,仪表台数据延迟:vp_alert → vp_sink → vp_dashboarder

  1. 查看上述日志是否有延迟,增加有延迟的进程的进程数(/opt/npm/etc/system/local/dataflow.xml)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值