前言
在对数据进行预处理中,我们经常会遇到缺失值和异常值的情况,下面我们对这两种情况的常用技术进行介绍,希望能帮到大家。
以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!
在数据既有缺失值又有异常值时,先处理哪个并没有严格的顺序。我习惯先处理异常值,再处理缺失值。
异常值的识别方法
异常值,指的是样本中的一些数值明显偏离其余数值的样本点,所以也称为离群点。常见的异常值判断方法可以分为以下两种情况:
(1)
在对数据进行预处理中,我们经常会遇到缺失值和异常值的情况,下面我们对这两种情况的常用技术进行介绍,希望能帮到大家。
以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!
在数据既有缺失值又有异常值时,先处理哪个并没有严格的顺序。我习惯先处理异常值,再处理缺失值。
异常值,指的是样本中的一些数值明显偏离其余数值的样本点,所以也称为离群点。常见的异常值判断方法可以分为以下两种情况:
(1)