一般来说,我们搜集到的数据因为种种原因都会出现缺失值,通常而言,我们有几种常见的解决方法,一种解决方法是直接去掉这些包含缺失值的行,不得不说这样的做法或多或少会影响到我们的后续的数据分析,特别是对数据量小的情况。因此我们要采用更好的策略来填充缺失的数据,例如通过已知的数据来推测。
Imputer提供了基本的填充方法,例如使用均值或者中位数填充,当然也有人使用众数,具体的你可以根据你的数据来定。
缺失值也可以使用0来表示:
一般来说,我们搜集到的数据因为种种原因都会出现缺失值,通常而言,我们有几种常见的解决方法,一种解决方法是直接去掉这些包含缺失值的行,不得不说这样的做法或多或少会影响到我们的后续的数据分析,特别是对数据量小的情况。因此我们要采用更好的策略来填充缺失的数据,例如通过已知的数据来推测。
Imputer提供了基本的填充方法,例如使用均值或者中位数填充,当然也有人使用众数,具体的你可以根据你的数据来定。
缺失值也可以使用0来表示: