(一) 归一化:
1.1目的:
解决量纲的不统一,将数据统一在0-1之间。
解释如下:
左边为归一化的原因是:量纲相同,所以权重的影响相同,如:y=0.1x1+100x2,此时没有做归一化处理,x2的结果会影响其值更严重。
1.2 计算公式:
1.3归一化的优缺点:
优点是一定可以把数值归一到 0到 1 之间,缺点是如果有一个离群值,正如我们举的例子一样,会使得一个数值为 1,其它
数值都几乎为 0,所以受离群值的影响比较大。
api: from sklearn.preprocessing import MinMaxScaler
(二) 标准化:
2.1 目的:
为了解决数据混乱,偏差严重的问题。
2.2 公式: