scikit-learn API
Wang_PChao
这个作者很懒,什么都没留下…
展开
-
Scikit-learn API:OrdinalEncoder类 顺序编码器
本博客关联博客:scikit-learn类别特征编码:顺序编码(OrdinalEncoder)、一位有效编码(OneHotEncoder)这篇博客说的主要是OrdinalEncoder顺序编码器的API文档参数说明属性和方法应用举例>>> from sklearn.preprocessing import OrdinalEncoder>>...原创 2020-03-04 23:30:47 · 4907 阅读 · 0 评论 -
Scikit-learn API:SimpleImputer类(原sklearn.preprocessing.Imputer类) 处理缺失值
scikit-learn提供了简单易用的方法进行缺失值的处理,使用SimpleImputer实例,我们可以指定用什么样的数值(例如中位数)填充某属性中的缺失值。函数原型和参数说明SimpleImputer类的属性和方法应用举例>>> import numpy as np>>> from sklearn.impute import Si...原创 2020-03-03 14:29:18 · 2418 阅读 · 1 评论 -
Scikit-learn API:StratifiedShuffleSplit类 按照数据分层进行抽样
类原型class sklearn.model_selection.StratifiedShuffleSplit(n_splits=10, test_size=None, train_size=None, random_state=None)功能将数据集按照指定的类别特征,分层地拆分为训练集、测试集,保证对于每一个特征值,训练集数量占比均相同;生成的交叉验证对象是StratifiedKF...原创 2020-02-29 00:31:01 · 1581 阅读 · 1 评论 -
Scikit-learn API:train_test_split函数 将数据分割为训练集和测试集
函数原型sklearn.model_selection.train_test_split(*arrays, **options)函数功能将数组或矩阵随机的分割成训练集和测试集,注意这里是随机的。假定某元素A第一次划分为测试集,在数据集中新增数之后,再进行划分则可能划分到训练集中。参数说明*arrays:长度或者shape[0]相同7的可索引序列。 允许的输入是列表、num...原创 2020-02-28 16:13:22 · 2213 阅读 · 0 评论