2. 去极值处理
不是删除,而是拉回正常范围。
2.1 三种方法
- 分位数去极值
- 中位数 绝对偏差去极值
- 正态分布去极值
3.分位数去极值
3.1 中位数
排序后,处于中间位置的那个数。Median
奇数:中间的那个数
偶数:中间两个数的平均值
3.2 四分位数
- 第一四分位数(Q1)排列后25%
- 第二四分位数(Q2)排列后 50% 中位数
- 第三四分位数(Q3)排列后75%
3.3 百分位数
百分位数:数据所处位置为整体的某个%位数
- 0 quantile = 0 percentile
- 0.25quantile = 25 percentile
- 0.50quantile = 50 percentile
- 0.75quantile = 75 percentile
3.4 分位数去极值
将分位数以外的极值&#x