立即学习:https://edu.csdn.net/course/play/26990/361135?utm_source=blogtoedu
异常值的处理:
- 指那些偏离正常范围的值,不是错误值
- 异常值出现频率较低,但又会对实际项目分析造成偏差
- 异常值一般用过箱线图法(分位差法)或者分布图(标准差法)来判断
- 异常值往往采取盖帽法或者数据离散化
一些细节:
分位差 = 上四分位数 - 下四分位数
上界 = 上四分位数 + 1.5 * 分位差
下界 = 下四分位数 - 1.5 * 分位差
立即学习:https://edu.csdn.net/course/play/26990/361135?utm_source=blogtoedu
异常值的处理:
一些细节:
分位差 = 上四分位数 - 下四分位数
上界 = 上四分位数 + 1.5 * 分位差
下界 = 下四分位数 - 1.5 * 分位差