MinMaxScaler(feature_range=(0,1))(sklearn库)

sklearn 库有六大模块,分别是分类、回归、聚类、降维、模型选择和预处理preprocessing。MinMaxScaler()函数在preprocessing模块,用来实现数据的归一化,即把数据映射到 [ 0,1 ] 。

1 怎么归一化

X_{scaler}=\frac{X-X_{min}(axis=0)}{X_{max}(axis=0))-X_{min}(axis=0)}\times (max-min)+min

其中min,max是指映射的最小值和最大值,一般是0和1;X_{min}(axis=0)X_{max}(axis=0)是指每列中元素的最小值和最大值,因为是对每一列做这样的归一化操作,这比较符合实际应用。

2 MinMaxScaler代码

import numpy as np
from sklearn.preprocessing import MinMaxScaler #从preprocessing库导入MinMaxScaler函数
scaler = MinMaxScaler(feature_range=(0, 1)) #数据转换的范围是[0,1],scaler代表min和max
x_1 = np.array([[3, -1, 2, 613],
                [2, 0,  0, 232],
                [0, 1, -1, 113],
                [1, 2, -3, 489]])
x_1_scaled = scaler.fit_transform(x_1)#scaler代表min和max,fit找出每列的Min和Max,将x(i,j)代入归一化公式进行transform
x_2 = np.array([[2, 1, 4, 7],
                [8, 7, 6, 6]])
x_2_scaled = scaler.transform(x_2)#每一列数据的归一化公式已确定,直接代入数据就可以。
#这里不用再次fit是因为scaler.fit_transform(x_1)已经确定了每列的归一化公式。由此可知x_2归一化数据,并不是把数据映射到 [ 0,1 ] ,只是用了和x_1一样的归一化公式。
print("矩阵1:\n",x_1)
print("归一化矩阵1:\n",x_1_scaled)
print("矩阵2:\n",x_2)
print("归一化矩阵2:\n",x_2_scaled)
#归一化矩阵1:
 [[1.         0.         1.         1.        ]
  [0.66666667 0.33333333 0.6        0.238     ]
  [0.         0.66666667 0.4        0.        ]
  [0.33333333 1.         0.         0.752     ]]
#归一化矩阵2:
 [[0.66666667 0.66666667 1.4       -0.212     ]
  [2.66666667 2.66666667 1.8       -0.214     ]]

3 数据验证

已知x_1第一列的Min和Max为0和3,映射min和max为0和1,可确定每列的归一化公式:

X=\frac{x-0}{3-0}\times 1+0

将第一列第一个数3代入公式,得X_{1_{scaler}}=\frac{3-0}{3-0}\times 1+0=1

将第一列第二个数2代入公式,得X_{2_{scaler}}=\frac{2-0}{3-0}\times 1+0=0.667

将第一列第三个数0代入公式,得X_{3_{scaler}}=\frac{0-0}{3-0}\times 1+0=0

将第一列第四个数1代入公式,得X_{4_{scaler}}=\frac{1-0}{3-0}\times 1+0=0.333

因此x_1_scaled的第一列应该是[1,0.667,0,0.333 ]^{T},可知计算结果与代码结果一致。

x_2第一列数据的归一化直接将数据代入下列归一化公式即可:

X=\frac{x-0}{3-0}\times 1+0

将第一列第一个数2代入公式,得X_{1_{scaler}}=\frac{2-0}{3-0}\times 1+0=0.666

将第一列第二个数8代入公式,得X_{2_{scaler}}=\frac{8-0}{3-0}\times 1+0=2.667

因此x_2_scaled的第一列应该是[0.667,2.667 ]^{T},可知计算结果与代码结果一致。

  • 8
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值