前言
前阵在查sklearn
的归一化方法MinMaxScaler
的时候,发现找到的文章解释的一塌糊涂,一般都是扔个公式加一堆代码就敷衍了事了,所以这次写一篇讲述MinMaxScaler
核心功能的文章。
公式
会查MinMaxScaler
的基本上都应该理解数据归一化,本质上是将数据点映射到了[0,1]
区间(默认),但实际使用的的时候也不一定是到[0,1]
,你也可以指定参数feature_range
,映射到其他区间,这个后面再讲。
首先了解该计算公式:
X s t d = X − X . m i n ( a x i s = 0 ) X . m a x ( a x i s = 0 ) − X . m i n ( a x i s = 0 ) X s c a l e d = X s t d ∗ ( m a x − m i n ) + m i n X_{std} = \frac{X - X.min(axis=0)}{X.max(axis=0) - X.min(axis=0)}\\ X_{scaled} = X_{std} * (max - min) + min X