对于异常值判断一般有两种方式: 一:z分数法 前提:样本需要复合正态分布 Z分数 = (原始取值-均值)/(标准差) 表示的是每个取值距离均值多少个标准差单位 结论:99.7%的数据都会落到均值3倍标准差之内的范围,所以正常值取值范围:均值 ± 3*标准差 二:上下限法-箱线图 上限 = Q3 + 1.5*(Q3 - Q1) 下限 = Q1 - 1.5*(Q3 - Q1) Q1 表示四分之一分位数 Q3 表示四分之三分位数