fit_transform和transform的区别

最新推荐文章于 2024-05-14 19:15:45 发布

Kaido0

最新推荐文章于 2024-05-14 19:15:45 发布

阅读量1.4w

点赞数 3

分类专栏： python 文章标签： python sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kaido0/article/details/52974049

版权

python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

经常看到数据读入——>对没用数据删除处理——>split分割数据分别作为训练，测试——>标准化数据...之后总会看到

ss=StandarScaler()
X_train=ss.fit_transform(X_train)
X_test=ss.transform(X_test)

我们使用sklearn进行文本特征提取/预处理数据。可以看到除训练，预测和评估以外，处理其他工作的类都实现了3个方法：fit、transform和fit_transform。从命名中可以看到，fit_transform方法是先调用fit然后调用transform，我们只需要关注fit方法和transform方法即可。

transform方法主要用来对特征进行转换。从可利用信息的角度来说，转换分为无信息转换和有信息转换。无信息转换是指不利用任何其他信息进行转换，比如指数、对数函数转换等。有信息转换从是否利用目标值向量又可分为无监督转换和有监督转换。无监督转换指只利用特征的统计信息的转换，统计信息包括均值、标准差、边界等等，比如标准化、PCA法降维等。有监督转换指既利用了特征信息又利用了目标值信息的转换，比如通过模型选择特征、LDA法降维等。通过总结常用的转换类，我们得到下表：

不难看到，只有有信息的转换类（训练数据）的fit方法才实际有用，显然fit方法的主要工作是获取特征信息和目标值信息，在这点上，fit方法和模型训练时的fit方法就能够联系在一起了：都是通过分析特征和目标值，提取有价值的信息，对于转换类来说是某些统计量，对于模型来说可能是特征的权值系数等。另外，只有有监督的转换类的fit和transform方法才需要特征和目标值两个参数。。

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
fit_transform和transform的区别

针对sklearn中的transform和fit_transform进行比较
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。