五数概括法:通俗的说就是最小,第一四分位,第二四分位,第三四分位,最大数
箱形图是基于五数概括法的数据的一个图形汇总。
箱形图的说明:
(1)边界分别为第一四分位数和第三四分位数
(2)在箱体上中位数即第二四分数处画垂线
(3)利用四分位数间距IQR = Q3-Q1,找到界限,超出即为异常值。
IQR左 = Q1 - 1.5×IQR
IQR右 = Q3 + 1.5×IQR
(4)虚线被称为触须线,触须线的端点为最小值和最大值
(5)每个异常值的位置用符号'*'来标出。
代码:
import numpy as np
l=[8408,1374,1872,8879,2459,11413,608,14138,6452,1850,2818,1356,10498,7478,4019,4341,739,2127,3653,5794,8305]
def fiveNumber(nums):
#五数概括 Minimum(最小值)、Q1、Median(中位数、)、Q3、Maximum(最大值)
Minimum=min(nums)
Maximum=max(nums)
Q1=np.percentile(nums,25)
Median=np.median(nums)
Q3=np.percentile(nums,75)
IQR=Q3-Q1
lower_limit=Q1-1.5*IQR #下限值
upper_limit=Q3+1.5*IQR #上限值
return Minimum,Q1,Median,Q3,Maximum,lower_limit,upper_limit
#
print(fiveNumber(l))