时序库VictoriaMetrics中rete是如何计算

前言

夜莺监控中推荐用的时序库是VM,后来在使用中知道了VM查询中使用的是兼容PromQL的另一套查询语法MetricsQL,虽然知道中rate不会像prometheus进行数据外推,而是用回溯窗口第一个遇到的数据,但是具体怎么选择不是特别清楚,我找了一些资料,并通过查询的原始数据,来验证一下这个说法是否正确。

问题定义

原始数据如下表:

valuetimetime_1time_2
242236796790@1690390711.6252023-07-27 00:58:310
242237434970@1690390726.6262023-07-27 00:58:46+15
242237857924@1690390741.6272023-07-27 00:59:01+15
242238425386@1690390756.6282023-07-27 00:59:16+15
242238849822@1690390771.6282023-07-27 00:59:31+15
242239535711@1690390786.6292023-07-27 00:59:46+15
242239952165@1690390801.6412023-07-27 01:00:01+15
242240510835@1690390816.6412023-07-27 01:00:16+15

原始公式是 rate(m[d]) = (vCurr - vPrev) / (tCurr - tPrev)

经计算rate(net_bytes_recv[1m]) 的结果如下:

  • 在时间段00:59:47-00:59:56的结果为35010.5994700265
  • 在时间段00:59:57-01:00:01的结果为37282.49855561975
  • 在时间段01:00:02-01:00:11的结果为34895.8742959976

那么推测一下rate(net_bytes_recv[1m]) 是怎么选择Curr和Prev的?是否和预期一致 —— 在一个采集数据的时间序列上,在时间戳t查询rate(m[d])函数,Curr取t之前最近的真实样本数据,Prev取t-d之前最近的真实样本数据。如果t-d之前没有真实样本或者丢失,Prev则会取t-d内时间最远的真实样本(个别特殊情况除外,如d<2*scrape_interval等)。

问题拓展

由于我其实对这个比较迷糊,逻辑上没有理解清楚,我就多试了些例子,并且像是发现一些新问题。

End_headEnd_tailEnd_DistStart_headStart_tailCurrPrevC_P_distE_t-CurrS_t-PrevCalc_rateRatediff
0:59:4200:59:460:00:040:58:420:58:4600:59:3100:58:4640:00:150:00:0031439.758167673431439.75823296740.0000652939997962676
0:59:470:59:560:00:090:58:470:58:5600:59:4600:58:4650:00:100:00:1035010.599457784635010.59947002650.0000122419005492702
0:59:5701:00:010:00:040:58:570:59:0100:59:4600:59:0140:00:150:00:0037282.498675712537282.49855561975-0.000120092699944507
1:00:021:00:110:00:090:59:020:59:1101:00:0100:59:0150:00:100:00:1034895.874331487334895.8742959976-0.0000354896983481012
1:00:121:00:160:00:040:59:120:59:1601:00:0100:59:1640:00:150:00:0033918.623500140733918.623508764140.00000862340675666928
valuetimetime_1time_2
2422367967901690390711.62500:58:310
2422374349701690390726.62600:58:4615
2422378579241690390741.62700:59:0115
2422384253861690390756.62800:59:1615
2422388498221690390771.62800:59:3115
2422395357111690390786.62900:59:4615
2422399521651690390801.64101:00:0115
2422405108351690390816.64101:00:1615
2422411877941690390831.64201:00:3115

问题1.为什么相同rate值的查询时间点End的时间范围差不一致,当前样本是有4,9
问题2.获取rate的真实取样间隔数目不一致是为什么,当前样本有4,5

分析数据

从Calc_rate结果上来看,连续值变更时候,样本选取的Curr和Prev在并不是同步变化的,而是依次变化,如上次选取Curr变化,这次选取Prev变化,多次之间重复,也就是导致了rate选取真实样本间隔数目来回跳变。
当查询时间点为真实数据点时,回查真实数据点时间最长,Curr取值为上一次真实数据值,同时Prev正好是另一个真实数据点,这点和d有关,这里d是60s,采集频次是15s,所以Curr和Prev最少间隔是4。
没有缺少数据的情况,数据回溯时间的最大区间为采集频次(在0:59:47-01:00:01,Curr均为00:59:46)

结果

通过这样数据分析,从一方面证明了VM在rate实现上和他所预期的效果是一致的,回溯数据范围为(t-d … t]。其次这些数据里给我的一个重要的认知就是数据范围,即查询点所产生数据不能被看到。具体来说,查询时间点是00:59:47可以看到00:59:46数据;而00:59:46只能选00:59:31数据,这点逻辑上可以类比更通俗例子,报名考试,假如截止日期是明天0点,提交报名信息在0点是不可以的,而11:59:59就是有效的,0点可能是关闭入口,要是没关闭入口提交记录了,在数据记录中会有0点数据,在统计报名有效报考的人中0点整的数据就需要被排除。

至于End时间范围不一致主要是因为虽然Curr选用相同数据,但是不同开始时间导致选用的Prev会不一致,Prev选取里不同的数据,从而产生了变化。取样间隔数不一致和采集数据频率有关,其他规律暂时没有发现。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值