scikit-learn中的数据变换方法

最新推荐文章于 2024-01-18 20:57:24 发布

Z字君

最新推荐文章于 2024-01-18 20:57:24 发布

阅读量275

点赞数

分类专栏：机器学习文章标签： sklearn 数据变换

本文链接：https://blog.csdn.net/zzc_zhuyu/article/details/86584106

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

scikit-learn中的数据变换方法

StandardScaler 每个特征的平均值为0、方差为1
RobustScaler 使用中位数和四分位数，会忽略异常值
MinMaxScaler 所有特征位于0和1之间
Normalizer 每个数据点进行放缩，使得特征向量的欧式长度为1

当模型返回数据的新表示时，使用transform方法

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()
scaler.fit(X_train)
X_train_scaled = scaler.transform(X_train)
print("transformed shape: {}".format(X_train_scaled.shape))
print("per-feature minimum before scaling:\n {}".format(X_train.min(axis=0)))
print("per-feature maximum before scaling:\n {}".format(X_train.max(axis=0)))
print("per-feature minimum after scaling:\n {}".format(
    X_train_scaled.min(axis=0)))
print("per-feature maximum after scaling:\n {}".format(
    X_train_scaled.max(axis=0)))

X_test_scaled = scaler.transform(X_test)
print("per-feature minimum after scaling:\n{}".format(X_test_scaled.min(axis=0)))
print("per-feature maximum after scaling:\n{}".format(X_test_scaled.max(axis=0)))

注：所有缩放器总是对训练集和测试集应用完全相同的变换，使得测试集的范围可能有所不同。

Z字君

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn中的数据变换方法

scikit-learn中的数据变换方法StandardScaler&amp;nbsp;每个特征的平均值为0、方差为1RobustScaler&amp;nbsp;使用中位数和四分位数，会忽略异常值MinMaxScaler 所有特征位于0和1之间Normalizer 每个数据点进行放缩，使得特征向量的欧式长度为1当模型返回数据的新表示时，使用transform方法from sklearn.prepr...
复制链接

扫一扫