在我们平时进行数据数据挖掘建模时,一般首先得对数据进行预处理,其中就包括数据缺失值、异常值处理、数据的标准化、归一化等等。
下面主要介绍如何对一个数据文件进行数据的缺失值处理、标准化和归一化
MID_SP | MID_AC | MID_R25 | MID_COND | LITHO1 |
55.195 | 395.7 | 3.65 | 253.883 | 0.238 |
62.514 | 403.406 | 6.633 | NAN | 0.051 |
69.307 | 410.574 | 3.656 | 303.685 | 0.332 |
NAN | 406.873 | 4.874 | 159.814 | 0.197 |
65.529 | 404.019 | NAN | 234.114 | 0.331 |
63.564 | 396.497 | 4.901 | 146.675 | 0.217 |
61.142 | 401.276 | 8.883 | 73.528 | 0 |
61.075 | 386.493 | 7.884 | 147.242 | NAN |