fit()
:计算并存储缩放参数(如均值、标准差、最小值、最大值等),但不改变数据本身。transform()
:根据fit()
计算出的参数对数据进行实际的缩放转换。
常见的使用模式
通常,fit()
和 transform()
是一起使用的,典型的步骤如下:
- 在训练集上调用
fit()
:使用训练集数据计算缩放参数。 - 在训练集上调用
transform()
:将训练集数据进行缩放。 - 在验证集或测试集上调用
transform()
:使用训练集上计算的参数对验证集或测试集进行缩放,而不会再调用fit()
。
这种流程确保了在验证和测试阶段,数据缩放时使用的是与训练阶段相同的标准,避免数据泄露或引入偏差。