简单了解一下fit_transform 和 transform 的区别
今天做kaggle上面的关于股票预测时,总是出现bug,找了好久才发现原来自己把训练集和测试集都进行了归一化拟合,今天写下来就是给自己长个记性(菜鸡菜鸡,决不放弃)好了 说正事
- fit_transform
他相当于fit(X).transform(X),意思就是先进行fit(),进行数据拟合,然后在进行transform() 进行标准化处理,一般来说对于训练集数据,我们应该对数据先进行拟合在进行标准化处理,因为使用fit.transform()是为了找到训练集上的方差和均值,但是在测试集上我们只需要对数据进行标准化处理而不需要进行拟合,所以对测试集进行transform() 即可,参考自己程序如下
X_train = feature_extraction.fit_transform(X_train.values)
X_test = feature_extraction.transform(X_test.values)
OK 就这样 给自己长个记性