箱形图分析

反映原始数据分布的特征,可以进行多组数据分布特征的比较。

绘制方法:
在这里插入图片描述

  • 上四分位点(Quartile): Q 3 Q_3 Q3
  • 中位数: Q 2 Q_2 Q2
  • 下四分位点: Q 1 Q_1 Q1
  • 四分位距(InterQuartile Range,IQR): I Q R = Q 3 − Q 1 IQR = Q_3-Q_1 IQR=Q3Q1
  • 上边缘:非异常值范围内的最大值, Q 3 + 1.5 I Q R Q_3+1.5IQR Q3+1.5IQR
  • 下边缘:非异常值范围内的最小值, Q 1 − 1.5 I Q R Q_1-1.5IQR Q11.5IQR

作用:

异常值处理: 异常值被定义为小于 Q 1 − 1.5 I Q R Q_1-1.5IQR Q11.5IQR或大于 Q 3 + 1.5 I Q R Q_3+1.5IQR Q3+1.5IQR的值。

  • 箱形图的绘制依靠实际数据,不需要事先假定服从特定的分布形式,没有对数据作出任何限制性要求,只是真实直观地表现出数据形状的本来面貌。
  • 箱型图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐压性,多达25%的数据可以变得任意远而不会很大地扰动四分位数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值