衡量两组数据的接近程度_性能数据分析时常用的统计方法

本文介绍了性能数据分析中衡量两组数据接近程度的统计方法,包括平均值、标准差、标准误和变异系数的概念及其应用场景。平均值受异常值影响较大,标准差和变异系数用于量化数据的离散程度,标准误描述不同采样数据的离散性。了解这些基础知识对于准确分析性能数据至关重要。
摘要由CSDN通过智能技术生成

基本概念

进行性能测试与分析时首先需要确认的是:

  1. 性能指标 (Performance Metric)
  2. 性能数据表达 (Perforamcne Data Presentation)

假设我们想分析一段时间内CPU使用量的情况,这个过程称为数据集中趋势的分析。使用最广范计算起来也非常简单的是平均值计算也称呼为 「算术平均值」, 数学表达式为:

3fecc06eab750984457b91bdc26111ef.png
image

即,「将总和除以样本数量」

这种表达方式(数据集中趋势)简单易懂并普遍应用在各个领域但它在分析性能数据时有个致命缺点:「最终结果受样本中异常值的影响非常大」

想象一下在一段时间内CPU都处于idle状态,但某时刻CPU使用量突然飙升并持续了两秒钟。计算这段时间内CPU使用量时峰值会被平均化并随着观察时间的变长其被平均化的程度更厉害。

在CPU飙升的两秒钟发生了事

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值