1 什么是异常值,列举一种找出连续型变量异常值的方法
异常值是指,与大部分样本值的差别较大,也就是离群值。
寻找连续型变量异常值的方法可以是这样的:
首先,计算样本的标准差;然后,以3倍的标准差作为阈值判断该值是否为异常值,集如果该值与均值的差的绝对值大于阈值,则该值为异常值,反之,为正常值。
1 什么是异常值,列举一种找出连续型变量异常值的方法
异常值是指,与大部分样本值的差别较大,也就是离群值。
寻找连续型变量异常值的方法可以是这样的:
首先,计算样本的标准差;然后,以3倍的标准差作为阈值判断该值是否为异常值,集如果该值与均值的差的绝对值大于阈值,则该值为异常值,反之,为正常值。