四分位数和箱线图

四分位数

四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。

箱线图

利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。

 

四分位差:IQR = Q3-Q1,IQR(interquartile range)

异常值:OUTLIER<Q1-1.5IQR  or OUTLIER>Q3+1.5IQR
 

from matplotlib import pyplot as plt
list = [1,2,3,4,5,6,7,8,20,18,15,100,80,3]

#求list的四分位点
def quartile_value(list,num):
    list.sort()
    location = num *(len(list)+1)/4
    location_int = int(location)
    quartile = list[location_int-1]*(location_int+1-location)+list[location_int+1-1]*(location-location_int)
    return quartile

Q1 = quartile_value(list,1)
Q2 = quartile_value(list,2)
Q3 = quartile_value(list,3)

IQR = Q3 - Q1
#较小值的内限
inner_outlier_low = Q1 - 1.5 * IQR
#较大值的内限
inner_outlier_high = Q3 + 1.5 * IQR

#较小值的外限
outer_outlier_low = Q1 - 3 * IQR
outer_outlier_high = Q3 + 3 * IQR

#温和异常值
for value in list:
    if outer_outlier_low<value<inner_outlier_low or inner_outlier_high <value <outer_outlier_high:
        print(value)

#极端异常值
for value in list:
    if value <outer_outlier_low or value > outer_outlier_high:
        print(value)

plt.boxplot(list,labels=['Data Analays'])
plt.title('Watch Data')
plt.show()

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值