二 描述统计分析

本文介绍了描述统计学的基本概念,重点讲解了平均值、四分位数(包括下四分位数Q1、中位数Q2、上四分位数Q3)的计算及其在箱线图中的应用,以及标准差作为衡量数据波动大小的指标。通过实例解释了如何识别和处理异常值,并讨论了标准差在不同场景下的应用,如质量管理的6σ体系。
摘要由CSDN通过智能技术生成

一 概念

描述统计学即用特定的描述性指标对复杂的数据进行归纳,无需知道所有数据信息即可描述数据集的整体情况

二 常用指标

1 平均值

  • 由于平均值对异常值不敏感,所以通常不能用平均值表示数据集的整体情况
  • 当数据集不存在异常值时可使用平均值衡量整体情况

2 四分位数

  • 与中位数有关且能够从整体上描述数据集的分布状态
  • 通过四分位数绘制箱线图从而识别异常值并做相应的处理
  • 无法显示数据集的波动幅度

四分位数的计算:

1)求中位数

i)按从小到大的顺序排列数据

其中最小值为下界,最大值为上界

ii)计算中间位置

  • 若n为奇数,则中位数是位于中间的数值
  • 若n为偶数,则中位数是中间两个数的平均值

2)求下四分位数/上四分位数

求中位数左/右边数据的中位数,得到下/上四分位数。

  • 下/上四分位数将中位数左/右边的数据一分为二
  • 下四分位数/中位数/上四分位数将整个数据分成了4份,每份数据的数目占整个数据集的25%

若以一组排序后的偶数序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37。

1)下四分位数Q1

i)确定四分位数的位置。

Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。

ii)根据位置,计算相应的四分位数。

Q1所在的位置=(14+1)/4=3.75,

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值