【归一化与反归一化sklearn】

杰酱

已于 2022-08-12 10:43:37 修改

阅读量2.1k

点赞数

文章标签： sklearn python 机器学习

于 2022-08-12 10:42:01 首次发布

本文链接：https://blog.csdn.net/hyj0000/article/details/126298936

版权

踩坑sklearn归一化操作

sklearn中的归一化操作，使用方法
假设input_data的大概样子是：

[[ 30.411077 121.835418]
 [ 30.409912 121.834347]
 [ 30.409468 121.833942]
 [ 30.409068 121.83357 ]
 [ 30.408667 121.833198]
 [ 30.407865 121.832457]
 [ 30.406667 121.831343]
 [ 30.406667 121.831343]
 [ 30.405903 121.83064 ]]

scalar1 = MinMaxScaler(feature_range=(-1, 1))
scalar2 = MinMaxScaler(feature_range=(-1, 1))
train_normX = scalar1.fit_transform(input_data[:,1].reshape(-1, 1))
train_normY = scalar2.fit_transform(input_data[:,2].reshape(-1, 1))

得到的train_normX 是
（注意数据是我截取的一部分，归一化结果肯定不对，只要看形式）

[[-3.91956346e-01]
 [-4.01374293e-01]
 [-4.04963622e-01]
 [-4.08197251e-01]
 [-4.11438965e-01]
 [-4.17922393e-01]
 [-4.27607114e-01]
 [-4.27607114e-01]
 [-4.33783347e-01]]

其中feature_range是需要归一化的范围，记住scalar一定要独立出来而且要是全局变量，方便之后做反归一化，反归一化必须用到scalar变量，相当于一个变化矩阵需要记住从input_data到train_normX 的变化过程。

x_pred = scalar1.inverse_transform(np.array(x_pred).reshape(-1, 1))
y_pred = scalar2.inverse_transform(np.array(y_pred).reshape(-1, 1))
x_lab = scalar1.inverse_transform(np.array(x_lab).reshape(-1, 1))
y_lab = scalar2.inverse_transform(np.array(y_lab).reshape(-1, 1))