传统机器学习过程(sklearn)
图1 机器学习处理过程示意图
在sklearn中,无论是编码过程,还是训练过程,都会碰到,fit,transform,fit_transform等字段,查阅相关资料后,现解释如下:
fit :求得训练集x的均值,方差,最大值,最小值;用于从训练数据生成学习模型参数。
transform:在fit基础上,进行标准化,归一化,降维等操作。从fit()方法生成的参数,应用于模型以生成转换后的数据集。
fit_transform(): fit和transform的组合,既包括了训练又包含了转换。