踩坑sklearn归一化操作
sklearn中的归一化操作,使用方法
假设input_data的大概样子是:
[[ 30.411077 121.835418]
[ 30.409912 121.834347]
[ 30.409468 121.833942]
[ 30.409068 121.83357 ]
[ 30.408667 121.833198]
[ 30.407865 121.832457]
[ 30.406667 121.831343]
[ 30.406667 121.831343]
[ 30.405903 121.83064 ]]
scalar1 = MinMaxScaler(feature_range=(-1, 1))
scalar2 = MinMaxScaler(feature_range=(-1, 1))
train_normX = scalar1.fit_transform(input_data[:,1].reshape(-1, 1))
train_normY = scalar2.fit_transform(input_data[:,2].reshape(-1, 1))
得到的train_normX 是
(注意数据是我截取的一部分,归一化结果肯定不对,只要看形式)
[[-3.91956346e-01]
[-4.01374293e-01]
[-4.04963622e-01]
[-4.08197251e-01]
[-4.11438965e-01]
[-4.17922393e-01]
[-4.27607114e-01]
[-4.27607114e-01]
[-4.33783347e-01]]
其中feature_range是需要归一化的范围,记住scalar一定要独立出来而且要是全局变量,方便之后做反归一化,反归一化必须用到scalar变量,相当于一个变化矩阵需要记住从input_data到train_normX 的变化过程。
x_pred = scalar1.inverse_transform(np.array(x_pred).reshape(-1, 1))
y_pred = scalar2.inverse_transform(np.array(y_pred).reshape(-1, 1))
x_lab = scalar1.inverse_transform(np.array(x_lab).reshape(-1, 1))
y_lab = scalar2.inverse_transform(np.array(y_lab).reshape(-1, 1))
我对一组坐标(x,y)中的x,y分别进行归一化和反归一化,可以看到分别使用各自的scalar进行,如果混了就回不到之前的取值范围了,会反。
同样的MaxAbsScaler()也是一样的使用方法,看你自己选取怎样的归一化方式。