机器学习
Wang_PChao
这个作者很懒,什么都没留下…
展开
-
Scikit-learn API:OrdinalEncoder类 顺序编码器
本博客关联博客:scikit-learn类别特征编码:顺序编码(OrdinalEncoder)、一位有效编码(OneHotEncoder)这篇博客说的主要是OrdinalEncoder顺序编码器的API文档参数说明属性和方法应用举例>>> from sklearn.preprocessing import OrdinalEncoder>>...原创 2020-03-04 23:30:47 · 4907 阅读 · 0 评论 -
Pandas API:fillna函数 填充缺失值
也可以使用scikit-learn填充缺失值:使用scikit-learn中的SimpleImputer(原sklearn.preprocessing.Imputer)处理缺失值函数原型以及参数说明用法举例>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],... [3, 4, np...原创 2020-03-03 21:53:06 · 981 阅读 · 0 评论 -
Scikit-learn API:SimpleImputer类(原sklearn.preprocessing.Imputer类) 处理缺失值
scikit-learn提供了简单易用的方法进行缺失值的处理,使用SimpleImputer实例,我们可以指定用什么样的数值(例如中位数)填充某属性中的缺失值。函数原型和参数说明SimpleImputer类的属性和方法应用举例>>> import numpy as np>>> from sklearn.impute import Si...原创 2020-03-03 14:29:18 · 2418 阅读 · 1 评论 -
机器学习-数据处理:使用corr()和scatter_matrix()函数寻找属性之间的相关性
在机器学习的数据分析阶段,找到那些和待预测量有较强关联的特征对解决问题有非常大的帮助,为解决这个问题,我们可以分别使用pandas提供的两个函数corr()和scatter_matrix()使用corr()函数计算每对属性之间的标准相关系数函数原型DataFrame.corr(self, method='pearson', min_periods=1)函数功能计算数值列的两两相...原创 2020-03-02 12:06:00 · 4528 阅读 · 0 评论