![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据预处理
AndrewTeng
这个作者很懒,什么都没留下…
展开
-
数据预处理--填充缺失值(scikit-learn SimpleImputer类)
SimpleImputer类提供了输入缺失值的基本策略。缺失值可以用常量值或使用缺失值所在列的统计信息(平均值、中位数或最频繁)进行填充。以下代码演示如何使用包含缺少值的列(轴0)的平均值替换缺少值。import numpy as npfrom numpy import nan as NAimp = SimpleImputer(missing_values=NA, strategy='me...原创 2019-07-24 15:49:38 · 11393 阅读 · 0 评论 -
数据预处理--特征缩放
1.class sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True)通过将每个特征缩放到给定范围来。该估计器(estimator)单独地将每个特征缩放和转换,使数值落在给定的范围内,例如, 介于0和1之间。MinMaxScaler类的参数有:feature_range : tuple (min, max), ...原创 2019-07-25 10:14:27 · 808 阅读 · 0 评论 -
数据预处理--生成多项式特征(PolynomialFeatures)
使用 scikit-learn提供的PolynomialFeatures 这个类可以进行特征的构造, 例如有两个特征a和b,由这两个特征构造的特征项为[1, a, b, a2, a*b, b2]。PolynomialFeatures 这个类有 3 个参数:degree:控制多项式的次数;interaction_only:默认为 False,如果指定为 True,那么就不会有特征本身和本身结合...原创 2019-08-02 15:37:32 · 4147 阅读 · 0 评论